先来看一看结果,发现:1.贾宝玉和袭人的关系最近。2.薛宝钗和自己的妈妈关系最近。3.贾宝玉和林黛玉逼格比较统一,薛宝钗属于独树一帜的逼格调性。4.大观园中可以看到邢岫烟经常出没... 还有更多秘密等你自己上手去训练模型并发现...
先来看一看结果,发现:
1.贾宝玉和袭人的关系最近。
2.薛宝钗和自己的妈妈关系最近。
3.贾宝玉和林黛玉逼格比较统一,薛宝钗属于独树一帜的逼格调性。
4.大观园中可以看到邢岫烟经常出没...
还有更多秘密等你自己上手去训练模型并发现...
开始写代码!
继续写代码!
把红楼梦的txt版(utf-8编码)一行一行读进来,用tqdm辅助显示进度条:
开始数据预处理,去除了标点符号、数字、停用词:
引入gensim库,并使用Word2Vec模型构造内部字典树,和训练神经模型:
注意,上面这块代码也可换做下面这样的简写法:
开始读入我们关心的人名、地名,并打印结果:
这里展示部分结果:(每个人名、地名之后跟的是与自己关系最密切/在100维词向量中最相近的名词)
最后我们看一下“黛玉”的坐标(100维),以及“黛玉”和“林黛玉”之间的相似度。
注意:相似度不为1(相似度等于1时代表词向量在每个维度上都完全相等)。是因为叫“林黛玉”时常为正式场合,直呼“黛玉”时一般属于日常情况,相信各位懂得~
特别介绍`graphrag-practice-chinese`项目,这是一个针对中文优化的GraphRAG应用实例,通过改进文本切分策略、使用中文提示词及选择更适合中文的模型等手段,显著提升了处理中文内容的能力。项目不仅包括详细的搭建指南,还提供了《红楼梦》全文的索引构建与查询测试示例,非常适合个人学习和研究。
要将图片中的人物和背景分离,可以使用图像处理和计算机视觉技术。Python中常用的库有OpenCV、Pillow和TensorFlow等。OpenCV介绍: OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库,它最初由Intel开发,现在由一个跨国团队维护。OpenCV提供了广泛的图像和视频处理功能
《庆余年》里面人物关系复杂,如果能画出一个人物关系图谱,可以直观的理解其中人物关系,更好的追剧。首先,用kimi下载庆余年的分集剧情,常见文章《AI网络爬虫:批量爬取电视猫上面的《庆余年》分集剧情》,然后,在kimi中输入提示词:一步步的思考:提取这本小说中的高频出现的核心人物,建立人物之间的关系图,用mermaid语法输出Kim的回复:根据所提供的文本内容,我们可以逐步提取小说中的核心人物,并尝
# 使用Python实现《红楼梦》人物关系图## 一、流程概述为了实现《红楼梦》人物关系图的可视化,我们可以遵循以下步骤:| 步骤 | 说明 ||------|------|| 1 | 收集和整理《红楼梦》中人物及其关系的相关数据。 || 2 | 使用Python的图形库(如Matplotlib和NetworkX)进行数据可视化。 || 3 | 绘制人物关系图
# 用Python探索《红楼梦》的人物关系《红楼梦》是中国古典文学的瑰宝,书中人物众多且关系错综复杂。利用Python,我们可以对人物关系进行探索,找出其中的联系和网络。本文将教你如何用Python实现这一目标。## 流程在开始之前,我们可以将整个过程分为几个关键步骤:| 步骤 | 任务描述 |
# 使用Python绘制《红楼梦》中人物关系网络图《红楼梦》是中国古典文学的一部巨著,书中的人物关系错综复杂。如果想要深入理解这些人物之间的关系,绘制人物关系网络图是一个非常有效的办法。本文将通过使用Python及相关的库来实现这一目标,从而帮助读者更直观地理解《红楼梦》中的人物关系。## 实际问题在进行人物关系分析时,我们会面临以下问题:1. 如何获取《红楼梦》中人物及其之间的关
# Python 实现《红楼梦》人物统计在这篇文章中,我们将一起实现一个统计《红楼梦》中人物出现频率的Python程序。这个过程将从构思、准备数据、编写代码到最后的数据可视化,我们将一步一步地进行。## 流程概述以下是我们完成这个任务的主要步骤:| 步骤 | 描述 ||------|------|| 1 | 收集《红楼梦》文本数据 || 2 | 预处理文本 ||
## Python红楼梦人物出场统计### 引言《红楼梦》是中国古代四大名著之一,也是中国古代小说的巅峰之作。其中涉及了众多的人物角色,每个角色都有着自己的故事和命运。为了更好地了解《红楼梦》中各个人物的出场情况,我们可以借助Python进行人物出场统计分析。### 准备工作在开始之前,我们需要先准备一份《红楼梦》的文本数据,可以从互联网上下载《红楼梦》的电子版文档,例如txt格式。将
在这个博文中,我将详细记录如何使用Python对《红楼梦》中的人物进行统计,并找出前30的人物。这个过程包括从问题背景的分析,到错误现象,根因分析、解决方案的实施,验证测试以及预防和优化的建议。## 问题背景《红楼梦》被视为中国文学的经典,在教育和文化研究中具有重要的地位。然而,随着文本复杂度的增加,关于其人物的分析成为了一个挑战。因此,进行人物统计不仅能助于研究,也有助于普及相关知识。业
HugeGraph是一款易用、高效、通用的开源图数据库系统(Graph Database,GitHub项目地址), 实现了Apache TinkerPop3框架及完全兼容Gremlin查询语言, 具备完善的工具链组件,助力用户轻松构建基于图数据库之上的应用和产品。HugeGraph-Studio:HugeGraph-Studio是HugeGraph的Web可视化工具,可用于执行Gremlin语句及
先来看一看结果,发现:1.贾宝玉和袭人的关系最近。2.薛宝钗和自己的妈妈关系最近。3.贾宝玉和林黛玉逼格比较统一,薛宝钗属于独树一帜的逼格调性。4.大观园中可以看到邢岫烟经常出没...还有更多秘密等你自己上手去训练模型并发现... 开始写代码! 1from tqdm import tqdm2#tqdm用来观察进度条,非必须3import jieba4import sys5imp
《红楼梦》作为我国四大名著之一,古典小说的巅峰之作,粉丝量极其庞大,而红学也经久不衰。所以我们今天通过 Python 来探索下红楼梦里那千丝万缕的人物关系,话不多说,开始整活!一、准备工作红楼梦txt格式电子书一份金陵十二钗+贾宝玉人物名称列表宝玉 nr黛玉 nr宝钗 nr湘云 nr凤姐 nr李纨 nr元春 nr迎春 nr探春 nr惜春 nr妙玉 nr
相信很多人都知道,《红楼梦》就是中国古典小说的巅峰之作,太多人沉迷其中,而红学也经久不衰。当然今天我们不是来探究小说的,而是通过 Python 来探索下红楼梦里那千丝万缕的人物关系开干~数据准备红楼梦 txt 电子书一份金陵十二钗 + 贾宝玉 人物名称列表 宝玉 nr黛玉 nr宝钗 nr湘云 nr凤姐 nr李纨 nr元春 nr迎春 nr探春 nr惜春 nr妙玉 nr巧姐 nr
嗨,大哥们,我来了!《红楼梦》作为我国四大名著之一,古典小说的巅峰之作,粉丝量极其庞大,而红学也经久不衰。所以我们今天通过 Python 来捋一下红楼梦里那错综复杂的人物关系,话不多说,开始整活!一、准备工作红楼梦txt格式电子书一份金陵十二钗+贾宝玉人物名称列表宝玉 nr黛玉 nr宝钗 nr湘云 nr凤姐 nr李纨 nr元春 nr迎春 nr探春 nr惜春 nr妙玉 nr巧姐
前言看到用机器学习方法分析红楼梦的文章不少,也有好几种方法,大观是因为纯文字的分析成本低吧,比较适合初学者练手,先转一两篇文章过来学习。所谓机器学习也是一些数学统计的方法,通过习惯用词来做判断, 也并不是很难。这里判定的维度越多越精准,下面判定仅供参考,仅供娱乐学习! 判定整体思路主要从以下几个方面可以进行粗略进行判定:1.写作习惯每个人写作都有一些与种不同的小习惯,这些小习惯并不会轻易就会发生改
统计《红楼梦》中出现最多的前20个名字# -*- coding: GBK -*-"""Spyder EditorThis is a temporary script file."""#coding:utf-8# -*- coding: GBK -*-names="林黛玉、薛宝钗、贾元春、贾迎春、贾探春、贾惜春、李纨、妙玉、史湘云、王熙凤、贾巧姐、秦可卿、晴雯、麝月、袭人、鸳鸯、雪雁、紫鹃
了解如何使用Spring Boot和AspectJ实现方法跟踪基础结构!最近在优锐课学习收获颇多,记录下来大家一起进步!在我们的应用程序中,获取方法的堆栈跟踪信息可能会节省很多时间。具有输入输出参数值和方法所花费的时间可以使查找问题变得更加容易。在本文中,我们将研究如何使用Spring Boot,AspectJ和Threadlocal为方法跟踪基础结构实现起点。在此示例中,我使用了: Spring
1.新建工程名为RotateDemo , File->New->Project ->single View Application -> next2.在view视图上添加两个Label,[cpp]view plaincopyprint?1. // RotateViewController.h2. #imp
这个时钟系列目前五篇分别是:《8266+DS3231时钟之开发个时钟遇到的N个坑【一】》《8266+ds3231时钟之arduino官网发布的DS3231库的分析【二】》《8266+DS3231时钟之DS3231具体实现及代码【三】》《8266+DS3231时钟之显示TM1638的使用【四】上》《8266+DS3231时钟之显示TM1638的使用【四】下》《8266+DS3231时钟之语音MP3-