88[ ![ Platform] ( https://img.shields.io/badge/platform-Windows%20%7C%20macOS%20%7C%20Linux-lightgrey.svg )] ( https://github.com/sansan0/bilibili-comment-analyzer )
99
1010</div >
11- B 站( bilibili)评论数据分析下载器 ,提供完整的评论采集与可视化分析功能。支持单视频和 UP 主批量评论下载 ,具备评论地区分布地图生成、词云分析等功能。内置多维度数据筛选、本地 HTTP 服务器等特性,为 B 站内容创作者 、数据分析师和吃瓜群众提供强大的评论数据洞察工具。
11+ B站(哔哩哔哩 bilibili)评论数据分析器 ,提供完整的评论采集与可视化分析功能。支持单视频和UP主批量评论下载 ,具备评论地区分布地图生成、词云分析、图片提取等功能。内置智能反爬策略、多维度数据筛选、本地HTTP服务器等特性,为B站内容创作者 、数据分析师和吃瓜群众提供强大的评论数据洞察工具。
1212
1313## 📋 目录
1414
@@ -17,25 +17,24 @@ B 站(bilibili)评论数据分析下载器,提供完整的评论采集与
1717- [ ⚠️ 使用声明] ( #️-使用声明 )
1818- [ 🚀 快速开始] ( #-快速开始 )
1919- [ 📖 使用指南] ( #-使用指南 )
20- - [ ⚙️ 配置说明] ( #️-配置说明 )
2120- [ 📊 数据分析功能] ( #-数据分析功能 )
2221- [ 📷 功能截图] ( #-功能截图 )
2322- [ ❓ 常见问题] ( #-常见问题 )
24- - [ 📞 交流方式 ] ( #-交流方式 )
23+ - [ 💬 问题反馈 ] ( #-问题反馈 )
2524- [ 🙏 致谢] ( #-致谢 )
2625- [ 📜 许可证] ( #-许可证 )
2726
2827## 🔄 更新日志
2928
30- ### v1.0.0 (2025-06-03 )
29+ ### v1.0.0 (2025-06-04 )
3130
3231** 🎉 首次发布**
3332
3433## ✨ 核心功能
3534
3635### 🎯 数据采集
3736
38- - ** 单视频评论下载** :支持 BV 号输入,获取完整评论数据
37+ - ** 单视频评论下载** :支持 BV 号,ep 号,ss 号输入,获取完整评论数据
3938- ** UP 主批量下载** :批量获取指定 UP 主的多个视频评论
4039- ** 图片资源下载** :自动提取并下载评论中的图片资源(评论区可能存在几个 GB 的图片数据,谨慎打开..)
4140
@@ -134,17 +133,6 @@ poetry run python run.py
134133 - ** 【✅ 浏览地图】** :查看地区分布热力图
135134 - ** 【✅ 浏览词云】** :查看交互式词云分析
136135
137- ## ⚙️ 配置说明
138-
139- ### 🔧 基础设置
140-
141- | 配置项 | 说明 | 默认值 | 建议值 |
142- | ------------ | ---------------- | -------------------- | ------------ |
143- | ** Cookie** | B 站登录凭证 | 空 | 扫码登录获取 |
144- | ** 输出目录** | 数据保存位置 | ` ~/.BiCoDown/output ` | 自定义路径 |
145- | ** 评论排序** | 默认排序方式 | 按点赞数 | 根据需求选择 |
146- | ** 生成地图** | 是否自动生成地图 | 是 | 建议开启 |
147-
148136## 📊 数据分析功能
149137
150138### 🗺️ 地区分布地图
@@ -154,7 +142,6 @@ poetry run python run.py
154142- 基于评论者 IP 属地生成中国省份热力图
155143- 支持按评论数、用户数、点赞数多维度展示
156144- 交互式地图,支持缩放和悬停查看详情
157- - 自动识别和统计未匹配地区
158145
159146** 支持的地区维度** :
160147
@@ -164,45 +151,13 @@ poetry run python run.py
164151- ⚡ 男女用户比例
165152- 🎯 用户等级分布
166153
167- ### ☁️ 词云分析
168-
169- ** 智能分词功能** :
170-
171- - 使用 pkuseg 中文分词引擎
172- - 自动过滤停用词和无意义词汇
173- - 智能识别和保留表情符号
174- - 支持自定义停用词表
175-
176154** 多维度筛选** :
177155
178156- 🌍 ** 按地区筛选** :查看特定地区用户的评论词云
179157- 👤 ** 按性别筛选** :分析不同性别用户的关注点
180158- 🏆 ** 按等级筛选** :了解不同等级用户的评论特点
181159- 📈 ** 实时统计** :动态显示筛选后的数据统计
182160
183- ** 可视化特性** :
184-
185- - 动态词云大小调整
186- - 高频词汇突出显示
187- - 支持词汇点击查看详情
188- - 响应式设计,适配不同屏幕
189-
190- ### 📈 统计分析
191-
192- ** 用户行为分析** :
193-
194- - 评论活跃度分布
195- - 用户等级构成比例
196- - 地域用户参与度对比
197- - 性别比例统计
198-
199- ** 内容质量分析** :
200-
201- - 高赞评论特征分析
202- - 回复互动热度统计
203- - 表情使用频率统计
204- - 评论长度分布分析
205-
206161## 📷 功能截图
207162
208163### 主界面概览
@@ -248,17 +203,9 @@ A:B 站的 IP 属地数据可能包含一些特殊地区名称,程序会尽
248203A:程序会自动过滤停用词、短词和无意义词汇。你可以查看停用词文件 ** stopwords.txt** 进行自定义调整。
249204
250205** Q:当前分词效果有些一般?**
251- A:我默认打包了较小的模型,不然一个压缩包几百兆太大了,你可以访问 https://github.com/lancopku/pkuseg-python 下载 releases 中的模型,解压覆盖到 web 目录就行。
252-
253- ## 📞 交流方式
254-
255- ### 👨💻 作者信息
256-
257- - ** 作者** :sansan
258- - ** GitHub** :[ @sansan0 ] ( https://github.com/sansan0 )
259- - ** 项目主页** :[ bilibili-comment-analyzer] ( https://github.com/sansan0/bilibili-comment-analyzer )
206+ A:我默认打包了较小的模型,不然一个压缩包几百兆太大了,你可以访问 https://github.com/lancopku/pkuseg-python 下载 releases 中的模型,推荐 [ default_v2] ( https://github.com/lancopku/pkuseg-python/releases/download/v0.0.25/default_v2.zip ) 模型,解压覆盖到 web 目录就行。
260207
261- ### 💬 社区交流与问题反馈
208+ ## 💬 问题反馈
262209
263210** 扫码关注作者微信公众号,以支持作者的幸苦开发,也可以更快的反馈使用问题:**
264211
0 commit comments