startup-plan/核心架构/deep-research-report (3).md

257 lines
32 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# NotebookLM 与 ima 深度研究报告
## 执行摘要
如果“知习”要做成一个真正可用、可被信任、可持续积累的学习型产品,最值得吸收的不是某个单点功能,而是两套不同的产品抽象:**NotebookLM 的“项目型笔记本”**,以及 **ima 的“长期知识库工作台”**。NotebookLM 把一次研究或一次课程学习压缩进一个独立 notebook上传来源后立刻进入“来源—问答—产物”闭环而且其最强优势并不是播客或思维导图而是**回答始终带证据、引文可悬停、可跳回原文上下文**这一套可信答案契约。citeturn32view0turn39view0turn20view0
ima 的思路则明显更偏“活知识库”:它以知识库为中心,覆盖个人库、共享库、知识库广场,以及“基于全网/基于知识库”的双问答入口并把报告、PPT、播客、测验、录音纪要、笔记写作等都串在一个工作台里。它的核心价值不只是“能问”而是**知识可沉淀、可协作、可流动、可复用**。这使它非常适合长期学习、备课、研究资料归档与组织协作。citeturn36view0turn26view0turn28view1turn26view1turn28view3
因此,对“知习”最优的方向不是二选一,而是做一个**双层结构**:底层是长期 Knowledge Base负责导入、加工、权限、版本与共享上层是面向一次学习任务的 Study Notebook 或 Study Session负责选源、问答、引用、总结、测验、播客与复习进度。这样既能获得 NotebookLM 的聚焦与可信回答,也能保留 ima 的长期沉淀与知识流转能力。citeturn32view0turn39view0turn28view1turn28view3
从设计优先级看,“知习”应把资源优先放在五件事上:**高质量导入与解析、可验证引用、阅读态中的问答、学习工坊式派生产物、学习进度闭环**。如果这五件事没有做好公共广场、Agent 个性化、社交分发都会变成噪音放大器;这其实正是 NotebookLM 与 ima 两者长处互补、短板互补后给出的最清晰结论。citeturn39view0turn32view0turn36view0turn28view3
## NotebookLM 完整链路
NotebookLM 的官方公开资料非常完整,且有简体中文帮助中心可直接复核。这使它特别适合被当作“知习”的**可信问答与学习产物系统**参考样板。官方信息显示NotebookLM 的基本抽象不是“总知识库”,而是**围绕单个项目或主题的 notebook**;每个 notebook 独立,不能跨 notebook 同时访问内容。用户新建 notebook 后上传或发现来源,系统在 Chat 面板中自动生成总摘要,并在 Studio 面板中生成或建议产物形成非常短的首个价值回路。citeturn32view0turn16view0
```mermaid
flowchart LR
A[首页] --> B[新建 Notebook]
B --> C[上传或发现来源]
C --> D[Sources 面板整理来源]
C --> E[Chat 自动生成总摘要]
E --> F[提出问题或下达操作指令]
F --> G[回答内嵌引用]
G --> H[悬停看引文]
G --> I[点击跳回原文上下文]
E --> J[Studio 生成学习产物]
J --> K[学习指南/FAQ/简报]
J --> L[思维导图]
J --> M[抽认卡/测验]
J --> N[音频概览]
J --> O[演示文稿/信息图]
G --> P[保存到笔记]
P --> Q[持续追问与复用]
```
| 维度 | NotebookLM 现状 | 对知习的启示 |
|---|---|---|
| 产品定位 | AI 研究助手,围绕“单个 notebook 对应单个项目/主题”展开目标是帮助理解复杂信息、整理思路而不是做一个无限扩张的长期总库。citeturn32view0turn14view4 | “知习”不应只有一个永久大库;必须有**按课程/专题切分的任务容器**。 |
| 支持导入类型 | 支持复制文本、Google Docs/Slides/Sheets、Word、PDF、CSV、PPTX、图片、音频、网页 URL、ePub、公开视频 YouTube URL单来源最多 50 万词或 200MB免费版每 notebook 最多 50 个来源。citeturn16view1turn19view0 | 导入层要覆盖文档、网页、图像、音频、视频转写;并把**文件大小/字数/来源数**作为清晰配额展示。 |
| 首次上传全流程 | 新建 notebook → 上传/发现来源 → Chat 面板立即生成总摘要 → 用户直接问答Studio 同时能生成笔记、音频、思维导图、报告、抽认卡/测验等。citeturn32view0 | 首屏必须让用户在第一次导入后**立刻看到摘要、至少一条可问建议、至少一个可生成学习产物**。 |
| 层级结构 | 顶层是 notebook其下是 sources5 个以上来源时可自动标签与分类,但并没有跨 notebook 的统一知识库对象。citeturn32view0turn10view0 | “知习”应保留 notebook 的聚焦感,但外面要再加一层 durable KB。 |
| AI 问答入口 | 入口核心在 Chat 面板;可勾选/取消勾选来源限定回答使用范围桌面端还支持配置回答风格与长度。citeturn39view0 | 问答入口应始终与“当前来源集”绑定,而不是只做全局聊天框。 |
| 回答如何引用来源 | 回答直接引用来源中的文字、图片与片段悬停可看完整引文点击可跳到原文位置与上下文。citeturn39view0 | 这是 NotebookLM 最该复制的地方:**引用不是装饰,而是证据交互**。 |
| 来源与引用如何展示 | 左侧 Sources 面板管理来源;对话内保存可点击内嵌引用;打开来源可看 source guide公开分享时还能选“仅限对话”或“完整笔记本”。citeturn16view1turn32view0turn18view0 | “知习”应区分**阅读态、问答态、分享态**三种证据显露级别。 |
| 派生内容支持 | Studio 支持笔记、音频概览、视频概览、思维导图、报告;报告类型含 FAQ、学习指南、简报文档还支持抽认卡/测验、数据表格、演示文稿、信息图。citeturn32view0turn17view2 | “知习”应把**学习指南、测验、思维导图、播客**做成一等对象,而不是藏在 prompt 里。 |
| Web 与 App 差异 | 移动端仅支持 PDF/网站/YouTube/音频/复制文字导入不支持笔记、思维导图、FAQ、学习指南、时间轴、简报文档不支持分享、对话配置和分析但支持 Fast Research、音频概览、抽认卡/测验、信息图、演示文稿等部分功能。citeturn33view0 | 适合采取**桌面全功能、移动端消费和轻编辑优先**的分层,而不是强行完全同构。 |
| 追问方式 | 标准连续对话可追问也可把回答保存为笔记后继续问音频概览还支持互动模式允许听播客时插话追问但目前仅英语。citeturn39view0turn40view2 | “知习”应允许**阅读中问、回答后追问、听播客时追问**三种链路。 |
| 会话历史持久化 | 对话记录会保留且仅自己可见用户可手动删除Studio 产物也可再次加载。citeturn39view0turn40view2 | 历史不应只是聊天记录,而应成为**可回访、可复用、可再派生**的学习资产。 |
| 可信度机制 | 明确声明对话回答只使用来源数据;引用可核查;同时官方也提示 AI 回答和输出可能不准确。隐私上除非用户主动提供反馈NotebookLM 内容不会直接用于训练基础模型。citeturn39view0turn18view1turn32view0 | “知习”应采用**证据前置 + 风险提示 + 默认不训练**的透明策略。 |
| 付费墙与限制 | 免费可用;付费通过 Google AI 方案升级额度。公开帮助页列出标准版与 Plus/Pro/Ultra 在 notebook 数、来源数、聊天数、音频/视频/报告/测验/思维导图等方面的差异高级共享仅向付费用户开放。citeturn19view0 | “知习”应把**存储、问答次数、派生产物次数、协作权限**拆开分层,而不是只卖“高级版”。 |
| 知习应复制 | 复制 NotebookLM 的三件事:**项目型 notebook、来源选择器、回答内证据跳转**。这些共同构成其“可信学习”体验的主骨架。citeturn32view0turn39view0 | 建议原样吸收。 |
| 知习应改造 | 不要照搬其“notebook 是唯一顶层对象”的做法否则长期学习资料会越来越碎。NotebookLM 的强项是聚焦不是沉淀。citeturn32view0 | 需要在 notebook 外再加 durable KB。 |
| 知习数据对象建议 | 从 NotebookLM 侧应吸收的对象是Notebook、Source、SourceLabel、Thread、Message、CitationAnchor、Artifact、StudyProgress。citeturn32view0turn39view0turn20view0 | 数据对象要先围绕**证据锚点与学习产物**设计。 |
| 知习页面与 UI 建议 | 桌面端最值得借鉴的是 Sources / Chat / Studio 三栏移动端则按“聊天、音频、测验、演示文稿”做标签化收纳。citeturn32view0turn33view0 | “知习”桌面宜三栏,移动宜分标签与底部工具栏。 |
## ima 完整链路
ima 的公开官方资料没有像 NotebookLM 那样系统化的帮助中心但其官网、App Store 页面与腾讯科技官方发文已经足以重建一条相对完整的产品链路。与 NotebookLM 明显不同ima 的顶层抽象是**知识库**,而不是 notebook并且其定位从一开始就不是“研究助手”而是**以知识库为基础的 AI 工作台**强调“搜—读—写”一体化以及长期沉淀、共享与应用。citeturn36view0turn26view0turn28view3
```mermaid
flowchart LR
A[首页/个人知识库] --> B[新建个人库或共享库]
B --> C[导入来源]
C --> C1[本地文件]
C --> C2[微信文件]
C --> C3[公众号文章/网页]
C --> C4[图片/音频]
C --> C5[笔记/既有问答结果]
C --> D[文档解读与要点提炼]
D --> E[基于知识库问答]
D --> F[基于全网问答]
E --> G[问答索引/跳原文]
F --> H[深度研究/脑图]
E --> I[笔记写作]
E --> J[AI解读]
J --> J1[思维导图]
J --> J2[AI播客]
J --> J3[AI测验]
E --> K[任务模式]
K --> K1[报告]
K --> K2[PPT]
K --> K3[播客]
B --> L[共享/权限设置]
L --> M[知识库广场/知识号]
E --> N[问答历史与持续使用]
```
| 维度 | ima 现状 | 对知习的启示 |
|---|---|---|
| 产品定位 | 以知识库为基础的 AI 工作台,强调“搜-读-写”一站式体验覆盖学习、办公、研究、整理、共享与内容生成。citeturn36view0turn28view3 | 顶层心智比 NotebookLM 更广,适合长期使用;“知习”可借其沉淀感,但不宜一开始做得过宽。 |
| 支持导入类型 | 官方公开资料明确支持本地文件、微信文件、公众号文章、网页、图片、音频;腾讯科技还披露可把笔记和 ima 内问答结果加入知识库;官网搜索结果显示支持 PDF/Office/Markdown 等 19 种格式;单文件上传上限已增至 200MB。citeturn36view0turn26view0turn5search1turn30view2 | “知习”应优先做**本地文件 + 网页 + 图片 + 音频 + 笔记剪藏**,并为生态化来源预留扩展位。 |
| 首次上传全流程 | 用户进入个人知识库或共享知识库后导入材料;文档解读会生成总结、提炼要点;随后可基于知识库或全网问答,也可直接进入 AI 解读或任务模式生成报告/播客/PPT。该流程在官方资料中分散出现但能拼出较完整的“导入—解读—问答—生成”闭环。citeturn26view0turn36view0 | 首传后不要只停在“导入成功”,而要立即给出**解读卡片、可问问题、可生成内容**。 |
| 层级结构 | 显式顶层对象是知识库;已支持多个个人知识库、共享知识库、知识库广场/知识号共享库内存在管理员、成员、访客等角色版本日志还显示知识库文件夹、搜索、移动、重命名等能力。citeturn28view1turn26view1turn29view2turn30view0turn37search0 | 这说明“知习”需要**KB 层、文件夹层、角色权限层**;不能只有平铺文件列表。 |
| AI 问答入口 | 腾讯科技明确写出 ima 有“基于全网”和“基于知识库”两种问答模式;还支持深度研究、生成脑图、文档解读、附件问答、@知识库回答以及移动端按住说话快捷提问。citeturn26view0turn28view3turn29view2turn30view1 | “知习”应至少有三类入口:**阅读态问答、知识库问答、开放检索问答**。 |
| 回答如何引用来源 | 官方没有像 NotebookLM 那样给出统一的“内嵌 hover 引文”说明,但版本日志清楚显示:问答索引可跳至 Word、笔记、txt、md、ppt 原文PDF 原文索引可跳转到引用位置报告可查看参考源。根据这些公开信息ima 的引用更像“索引/参考源/跳回原文”机制而不是强定义的对话内证据卡。这里属于基于官方版本日志的谨慎推断。citeturn30view1turn30view2 | “知习”应把 ima 的“跳原文”做得更显性,升级成**统一证据系统**。 |
| 来源与引用如何展示 | 官方公开内容显示文档问答会自动匹配相关图表任务模式报告支持查看参考源、目录展示与导出问答结果内表格展示也被单独优化。citeturn36view0turn30view1turn30view2 | “知习”可把来源展示做成三层:**引文片段、源内定位、可视化补充**。 |
| 派生内容支持 | 官方说明覆盖总结、要点提炼、思维导图、AI 播客、知识小测验、报告、PPT、录音纪要、笔记写作和配图但可访问资料中未见 NotebookLM 那种明确的一等“学习指南”对象。citeturn36view0turn26view0turn30view0 | “知习”应在 ima 的生产力产物之上,再补一个更强的**教学法导向产物层**。 |
| Web 与 App 差异 | ima 的公开呈现更像“桌面客户端/小程序 + App”而非标准浏览器型 SaaS。官网首页明显以“打开电脑版”为主小程序已支持在微信中直接导入文件、分享/加入知识库并基于知识库或全网问答App 端则持续补齐按住说话、Pad PDF 对照翻译、报告导出 Word/PDF、多个人知识库等能力。citeturn3view0turn28view1turn29view2turn30view0 | “知习”若面向中文学习场景,端策略应考虑**桌面深度创作、移动轻输入/复习、社交入口导入**三分。 |
| 追问方式 | 公开版本日志显示问答消息可修改;笔记面板的 AI 写作支持多轮追问和知识库调用写作移动端还有按住说话发问。citeturn28view0turn29view2 | “知习”应把追问做成**问题修订、上下文续问、语音补问**三种模式。 |
| 会话历史持久化 | 官网与搜索结果把“问答历史”作为一级导航但公开资料未说明留存周期、删除策略与细粒度控制。citeturn3view0turn38search0 | “知习”应明确历史模型:**自动保存、分线程、可删除、可转学习卡**。 |
| 可信度机制 | 官方对外反复强调知识库 + RAG 链路;共享库可设置成员是否可查看原文件、是否需审批加入;知识库广场与知识号承载专业/权威内容;腾讯科技还公开表示,用户上传的个人资料仅用于 AI 检索与推理不用于模型训练。citeturn28view1turn28view3 | ima 在“权限、安全、知识流通”上思路成熟;但“答案证据交互”仍弱于 NotebookLM。 |
| 付费墙与限制 | App Store 标注免费;共享知识库访客仅可进行 3 轮问答,加入成为成员后无限问答;公开权益页写明兑换码可解锁任务模式并扩容到 100G大学生认证也可获得 100G 与任务模式;单文件上传上限 200MB。公开入口更像“权益解锁”而非清晰的标准订阅价阶。citeturn36view0turn28view1turn24search1turn30view2 | “知习”适合采用**免费基础 + 存储权益 + 生成额度 + 协作权限**的组合,而不是只卖一个 pro。 |
| 知习应复制 | 最值得复制的是:**多知识库结构、共享库权限、公共知识发现、任务模式把知识库转成可交付成果**。citeturn28view1turn26view1turn26view2turn28view3 | 建议吸收为“长期层”。 |
| 知习应改造 | ima 的信息架构偏宽学习专用产物不够强证据展示虽然存在但不够统一、显性。citeturn36view0turn30view1turn30view2 | “知习”应更聚焦“学习材料生成与证据验证”,减少泛工作台噪音。 |
| 知习数据对象建议 | 从 ima 侧最该吸收的对象是KnowledgeBase、Folder、Source、PermissionRole、SourceReference、Artifact、TaskRun、PublicListing、HistoryThread。citeturn28view1turn26view1turn30view2 | “知习”需要把**权限与共享**纳入一开始的数据模型。 |
| 知习页面与 UI 建议 | 适合借鉴 ima 的“知识库首页 + 阅读/问答一体 + 任务模式 + 广场”框架但要把广场降级为次级入口把证据面板前置。citeturn3view0turn36view0turn26view1 | “知习”首页应先是**我的学习资产**,再是“发现”。 |
## 核心对比
一句话概括:**NotebookLM 优化的是“在封闭来源集里做高信任学习”ima 优化的是“围绕长期知识库做导入、协作与生产”**。因此“知习”不能只学其中一边否则要么资料沉淀能力不足要么回答可信度与学习结构不够强。citeturn39view0turn32view0turn28view1turn28view3
| 维度 | NotebookLM | ima | 知习取舍 |
|---|---|---|---|
| 产品定位 | 项目型研究/学习助手 | 知识库型 AI 工作台 | 采用“双层定位”:长期 KB + 短期学习 notebook/session。citeturn32view0turn36view0 |
| 支持导入类型 | 全面且规范含网页、音频、YouTube、ePub 等 | 更偏中文生态与工作资料,含微信文件、公众号文章 | 优先覆盖中文学习高频来源同时保留多模态标准导入。citeturn16view1turn36view0turn26view0 |
| 首次上传流程 | 导入后立刻得到总摘要与 Studio 建议 | 导入后偏“解读/问答/任务”分流 | 首传后应同时露出摘要、问题建议、学习产物、任务产物。citeturn32view0turn26view0turn36view0 |
| 层级结构 | notebook > source | knowledge base > folder/source/role | 用 KB 承载长期沉淀,用 notebook/session 承载一次学习任务。citeturn32view0turn28view1turn30view2 |
| AI 问答入口 | 以 Chat 面板为中心 | 全网问答、知识库问答、文档解读、任务模式 | 问答入口要“场景化”但必须统一回答协议。citeturn39view0turn26view0 |
| 回答如何引用来源 | 强证据合同,悬停与跳转完善 | 以索引/参考源/跳原文为主,证据显性略弱 | 以 NotebookLM 为底线,以 ima 的索引覆盖更多格式。citeturn39view0turn30view1turn30view2 |
| 来源/引用如何展示 | 来源面板 + 聊天内引文 + 上下文跳转 | 参考源 + 原文跳转 + 配图/表格增强 | 做“证据三层 UI”引文、原文定位、可视化辅助。citeturn39view0turn36view0turn30view1 |
| 派生内容 | 学习导向极强,学习指南/测验/抽认卡清晰 | 生产导向更强,报告/PPT/纪要/播客更全 | 学习工坊做 NotebookLM 风格,任务工坊做 ima 风格。citeturn32view0turn36view0turn26view2 |
| Web 与 App 差异 | 浏览器为主,移动端有限制 | 桌面客户端/小程序/App 并行 | 桌面做深度学习移动做复习与轻操作社交入口做导入。citeturn33view0turn3view0turn28view1 |
| 追问方式 | 连续对话成熟,音频可互动 | 问答消息可修改,笔记支持多轮追问 | 既要上下文追问也要“改写问题再问”。citeturn39view0turn40view2turn28view0 |
| 会话历史 | 明确保留、可删除 | 有问答历史入口,但公开规则较少 | 历史策略必须在产品内显式说明。citeturn39view0turn38search0 |
| 可信度机制 | 引文核查 + source-only 回答 + 隐私透明 | 权限安全 + RAG + 专业知识库 + 不训练用户资料 | “知习”应同时做**证据可信**与**知识源可信**。citeturn39view0turn18view1turn28view3 |
| 付费墙与限制 | 免费 + AI 方案升级配额 | 免费 + 权益解锁 + 共享场景限制 | 商业化要拆成存储、计算、协作三条。citeturn19view0turn24search1turn28view1turn36view0 |
| 知习应复制 | 强引文与学习产物分类 | 多库、广场、任务模式、中文导入生态 | 两者都要但必须统一底层对象与证据协议。citeturn32view0turn39view0turn28view1turn36view0 |
| 知习应改造 | 补长期沉淀层 | 收窄信息架构、强化教学法对象 | 最终目标不是“更像谁”而是“更适合学习闭环”。citeturn32view0turn36view0 |
| 知习数据对象建议 | 偏 notebook / citation / artifact | 偏 KB / role / task / public listing | 采用复合模型而非单核模型。citeturn32view0turn28view1turn28view3 |
| 知习页面/UI建议 | 三栏式研究界面 | 知识库首页 + 广场 + 任务模式 | 桌面三栏,首页 KB 卡片化移动以复习与轻问答为主。citeturn32view0turn3view0turn36view0 |
| 整体 UX | 克制、专注、以证据为核心 | 宽而强、以知识流与产出为核心 | “知习”应走中间路线专注学习但保留沉淀与协作。citeturn32view0turn36view0 |
| 数据模型 | 轻容器、强来源、强产物 | 重知识库、重权限、重流转 | 先建强对象模型再做花哨功能。citeturn32view0turn28view1turn28view3 |
| 商业化 | 方案订阅、按额度分层 | 免费入口 + 权益解锁 + 生态扩散 | 可先免费切入,再按“存储/生成/协作/公开发布”分层。citeturn19view0turn24search1turn36view0 |
## 知习 一体化方案
“知习”最合理的整合方向,是把 **NotebookLM 的可信学习界面** 放在 **ima 的长期知识库骨架** 上。也就是说,用户的资料不应该只存在于一次性 notebook 里,也不应该一股脑堆进无边界的大库;而应先进入可管理、可共享、可分权限的 Knowledge Base再从中抽取一组来源创建某次课程或专题的 Study Session。这样既保留长期记忆也保留短期聚焦。citeturn32view0turn28view1turn28view3
```mermaid
flowchart LR
A[知习首页] --> B[我的知识库]
A --> C[新建学习专题]
B --> D[导入中心]
D --> D1[文件/网页/图片/音频]
D --> D2[剪藏/笔记]
D --> D3[外部生态导入]
D --> E[解析与索引]
E --> F[来源预览与清洗]
F --> G[进入 Knowledge Base]
G --> H[从 KB 选源创建 Study Session]
H --> I[阅读 + 问答]
I --> J[内嵌引用]
J --> K[跳原文/看上下文]
I --> L[学习工坊]
L --> L1[总结]
L --> L2[思维导图]
L --> L3[学习指南]
L --> L4[测验/抽认卡]
L --> L5[播客]
L --> L6[讲义/PPT]
L --> M[任务工坊]
M --> M1[报告]
M --> M2[作业草稿]
M --> M3[复习提纲]
L --> N[学习进度]
N --> O[错题/薄弱点复习]
O --> H
```
### 推荐数据对象模型
下表是面向“知习”的推荐对象模型。它刻意把 **KB****Study Session** 分开,这正是吸收两款产品长处之后最关键的结构决定。
| 对象 | 核心字段 | 关系 | 设计理由 |
|---|---|---|---|
| User | id, profile, prefs | 1:N Workspace / KB / Session | 记录个体偏好,但不把个体记忆和知识内容混在一起。 |
| Workspace | id, name, type | 1:N KnowledgeBase | 面向个人、班级、项目组等组织场景。 |
| KnowledgeBase | id, title, scope, visibility | N:1 Workspace1:N Source / Folder | 承载长期沉淀,是 ima 的强项。 |
| Folder | id, name, parent_id | N:1 KnowledgeBase | 满足课程章节、学期、专题等层级归档。 |
| Source | id, type, uri, title, version_state | N:1 KB / Folder1:N Chunk / CitationAnchor | 统一管理文件、网页、图片、音频、笔记等来源。 |
| SourceVersion | id, source_id, checksum, created_at | N:1 Source | 支持重新解析、重建索引、版本回退。 |
| Chunk | id, source_id, text, embedding_id | N:1 Source | 检索核心对象。 |
| CitationAnchor | id, source_id, chunk_id, locator | N:1 Source / Chunk | 支持“句子级/段落级/页码级/时间戳级”跳转。 |
| StudySession | id, title, goal, selected_sources | N:M Source1:N Thread / Artifact | 对应一次课程学习、一次备考专题、一次论文阅读。 |
| Thread | id, session_id, mode | N:1 Session | 支持阅读问答、开放检索问答、复习问答等不同线程。 |
| Message | id, thread_id, role, text, cited_anchors | N:1 Thread | 聊天记录和证据引用统一存储。 |
| Artifact | id, session_id, type, prompt, output_ref | N:1 Session | 总结、脑图、学习指南、测验、播客、PPT、报告等统一管理。 |
| QuizAttempt | id, artifact_id, score, weak_points | N:1 Artifact | 把“生成测验”升级成“有反馈的学习闭环”。 |
| FlashcardState | id, artifact_id, card_id, mastery | N:1 Artifact | 记录“已掌握/未掌握/待复习”。 |
| SharePolicy | id, owner_id, object_type, mode | 作用于 KB / Session / Artifact | 需要同时支持私有、团队共享、只读分享、公开发布。 |
| MemoryProfile | id, user_id, editable_fields | N:1 User | 若未来做个性化记忆,必须用户可见、可改、可删。 |
### 推荐页面与 UI 设计
从界面层看,最值得采用的是“**首页看资产,阅读时问答,学习时进工坊**”这三个主要场景而不是让用户一进入产品就面对一个大而空的聊天框。NotebookLM 已经证明三栏结构适合深度研究ima 则证明知识库首页、共享、发现与任务模式对长期使用很重要。citeturn32view0turn3view0turn36view0
| 页面 | 主任务 | 关键模块 | 设计要点 |
|---|---|---|---|
| 首页 | 进入长期资产或新建学习专题 | 最近知识库、最近专题、继续学习、导入捷径 | 默认入口应是“继续学习”,不是空白输入框。 |
| 导入中心 | 把资料变成可问可学对象 | 文件上传、网页导入、剪藏、解析预览、清洗选项 | 解析前给用户一次“保留哪些页面/段落/图片/时间段”的机会。 |
| 知识库页 | 组织长期资料 | 文件夹树、来源列表、筛选、权限、共享 | 更像资料库,而不是聊天页。 |
| 阅读问答页 | 看原文、问问题、核引文 | Reader、Chat、Citation Drawer | 桌面端三栏:左来源树,中阅读区,右问答与引用。 |
| 学习工坊 | 生成学习材料 | 总结、脑图、学习指南、测验、播客、讲义/PPT | 强制所有产物都挂回 Session 与 CitationAnchor。 |
| 任务工坊 | 生成可交付内容 | 报告、作业草稿、汇报稿、讲义生成 | 与学习工坊并列,避免学习能力被“办公化”淹没。 |
| 复习中心 | 形成闭环 | 错题、薄弱点、复习计划、掌握度 | 这是两款产品都还没做深的空位,知习应优先占领。 |
| 发现页 | 使用公共优质内容 | 推荐知识库、官方课程包、学科精选 | 作为二级入口,不应压过“我的学习资产”。 |
### 推荐 ER 图
```mermaid
erDiagram
USER ||--o{ WORKSPACE : owns
WORKSPACE ||--o{ KNOWLEDGE_BASE : contains
KNOWLEDGE_BASE ||--o{ FOLDER : organizes
KNOWLEDGE_BASE ||--o{ SOURCE : stores
SOURCE ||--o{ SOURCE_VERSION : has
SOURCE ||--o{ CHUNK : splits_into
CHUNK ||--o{ CITATION_ANCHOR : grounds
USER ||--o{ STUDY_SESSION : creates
STUDY_SESSION }o--o{ SOURCE : selects
STUDY_SESSION ||--o{ THREAD : contains
THREAD ||--o{ MESSAGE : includes
MESSAGE }o--o{ CITATION_ANCHOR : cites
STUDY_SESSION ||--o{ ARTIFACT : generates
ARTIFACT ||--o{ QUIZ_ATTEMPT : records
ARTIFACT ||--o{ FLASHCARD_STATE : tracks
USER ||--o{ MEMORY_PROFILE : edits
USER ||--o{ SHARE_POLICY : controls
```
最终建议可以压缩成一句产品决策:**知习应当是“学习型知识库 + 证据型问答 + 工坊型产物 + 进度型复习”的组合,而不是“聊天 + 上传”或“网盘 + AI”中的任何一种。** 这也是 NotebookLM 与 ima 在产品形态上最值得被综合、同时也最值得被超越的地方。citeturn39view0turn32view0turn28view1turn28view3
## 优先来源
下表列出本报告优先采用的官方/一级来源。两款产品都未在可访问范围内提供类似论文级的公开技术细节,因此 NotebookLM 主要依赖官方帮助中心与 Google 官方发布文ima 主要依赖官网、App Store 页面与腾讯科技官方发文。
| 产品 | 优先来源 | 用途 |
|---|---|---|
| NotebookLM | 官方帮助中心总入口。citeturn16view0 | 确认功能全景与官方术语。 |
| NotebookLM | 《在 NotebookLM 中创建笔记本》。citeturn32view0 | 确认首传流程、三栏结构、Studio 产物、分享与分析。 |
| NotebookLM | 《为笔记本添加或探索新来源》。citeturn16view1 | 确认导入类型、来源限制、静态副本逻辑。 |
| NotebookLM | 《在 NotebookLM 中使用对话功能》。citeturn39view0 | 确认问答入口、内嵌引用、历史保留与保存到笔记。 |
| NotebookLM | 《在 NotebookLM 中使用思维导图》。citeturn20view0 | 确认脑图交互与下载分享。 |
| NotebookLM | 《在 NotebookLM 中生成音频概览》。citeturn17view1turn40view2 | 确认播客形态、互动模式、分享方式与语言。 |
| NotebookLM | 《NotebookLM 移动应用入门》。citeturn33view0 | 确认 Web/App 差异。 |
| NotebookLM | 《升级 NotebookLM》。citeturn19view0 | 确认免费/付费额度与高级共享。 |
| NotebookLM | 《NotebookLM 中的隐私权和使用条款》。citeturn18view1 | 确认训练与反馈政策。 |
| ima | 官网首页与可索引页面。citeturn3view0turn37search0turn38search0 | 确认入口结构、问答历史与知识库角色线索。 |
| ima | iOS App Store 官方产品页。citeturn36view0 | 确认定位、核心功能、导入来源、AI 解读、播客、测验、图表增强。 |
| ima | App Store 版本历史。citeturn29view2turn30view0turn30view1turn30view2 | 确认多个人知识库、问答索引跳原文、报告参考源、PPT、附件问答、200MB 等演进细节。 |
| ima | 腾讯科技《ima.copilot 上线 Windows 版本》。citeturn26view0 | 确认“全网/知识库”双问答、深度研究、文档解读、笔记/Q&A 入库。 |
| ima | 腾讯科技《ima 升级知识库支持共享和上线小程序》。citeturn28view1 | 确认共享知识库、角色权限、访客 3 轮问答、小程序导入与问答。 |
| ima | 腾讯科技《知识库支持发布和发现》。citeturn26view1 | 确认知识库广场、公开生态与跨端同步。 |
| ima | 腾讯科技《上线 PPT 生成功能》。citeturn26view2 | 确认任务模式与知识库驱动的输出逻辑。 |
| ima | 腾讯科技 WAIC 演讲稿。citeturn28view3 | 确认三层架构、RAG、权限/安全、用户上传资料不训练。 |
| ima | 官方权益兑换页与 App Store 活动。citeturn24search1turn36view0 | 确认任务模式与 100G 存储的权益化解锁信号。 |