DeepRead 开发笔记

项目起因

  1. 检索
  2. 整理观点 - 引用原文
  3. 讨论观点 - 深度思考

如果让我和这个东西聊天,那我会非常难绷。

我甚至怀疑我们读的是不是同一本书……

思路

  1. 获取更高质量的书评,从大量高质量书评中分析和思考
  2. 对书评中客观部分和主观部分分离,从而进行有效的信息合并和讨论
  3. 对书评中引申话题进行挖掘,可以进入更深层的讨论

到此处,第一阶段完成,可以生成类似 DeepResearch 的高质量长书评。

模块

数据收集

  • 豆瓣长评爬虫
    • 对不同译本的评论进行整理和收集
  • Bilibili/YouTube 视频爬取
    • 对书评视频下载,转字幕,修正

粗洗

  • 清晰数据
  • 拆解书评,分解成:「剧情」、「感受」、「评价」和「延伸思考」四个模块
  • 生成 csv 格式表格

  • 剧情是客观的,可以整理合并
  • 感受是因人而异的,要模拟我的视角
  • 评价是主观的,要分析并给出这么评价的原因
  • 延伸思考是复杂的,适当结合网络搜索去进行拓展

下一步开发

  • 基于生成的长书评和 Deep Research 的框架,可以对书内容进行深度讨论和交互
  • 结合之前的 podcast,让我和 DeepSeek 做一期书评播客

测试:半自动播客

产品见文档

References

https://github.com/Chivier/DeepReader


DeepRead 开发笔记
http://blog.chivier.site/2025-02-25/2025/DeepRead-开发笔记/
Author
Chivier Humber
Posted on
February 25, 2025
Licensed under