与AI相关 /2025-09-19

Review Summary

Overall: 一篇关于 AI 能力与局限性的真诚个人反思。作者基于一手使用经验提出的担忧具有现实意义，行文流畅，但存在个别事实性错误和结构可优化之处。

Critical issues:

“GPT5” 并非已发布模型——截至本文日期（2025年9月）及当前（2026年5月）均未发布
“AI的问题"首段信息密度过高，“两个问题"作为本节核心论点被淹没在文字中
“无时无刻"缺少否定搭配，语义与作者本意相反

Annotations: 4 条标注——见下方内联区块。

AI的问题

自从对话式AI出来以后，我就一直使用AI辅助我的工作与学习。最初，我觉得AI很强大，好像什么都懂，但是随着我的使用，我发现AI的能力是有问题的，即使是现在最顶级的通用大模型，Gemini 2.5 Pro, 以及GPT5, 也存在很多问题。

我对AI的机制不太清楚，但是似乎是依据前面的文字，推断下一个哪个文字的概率是最大的(这似乎也解释了为什么即使使用同样的提示词，模型还是会给出不完全一样的回答)。如果是这种机制的话，就算它表现得出来似乎是能够理解自然语言，但是其本质还是没有思考能力的。以前我听到一个什么理论，如果一个东西长的像鸭子，叫的也像鸭子，那它就是一个鸭子。这个理论似乎可以套在很多东西上；如果以结果为导向作为评价结果，这句话好像没什么问题，实际上很多问题也的确是以最终结果为导向的。但是用这个理论套在大模型上，真认为大模型具有思考能力，我认为是不太合理的。如果仅仅认为两个东西表现的相似就认为他们是同一个东西，显然太过片面。大模型似乎更像是一个极其强大，对大量信息能够进行搜索的引擎。如果用于训练的数据，某个观点的内容比较多，它似乎更倾向于在一个问题上表现出该观点。当然，我觉得这就是大模型的用处。当你询问它问题时，它可以陈述出现有的所有观点，让我们快速了解已有的知识。但这也是问题所在，在我的使用过程中，有两个问题，我觉得是无法解决的。

[Accuracy] “GPT5” 并非已发布的模型。截至本文日期（2025年9月），OpenAI 发布的最新模型为 GPT-4o 和 o1 系列；截至当前（2026年5月），GPT-5 仍未发布。

Principle: 在论述中引用具体产品名称时，应确保该产品确实存在且已公开发布。OpenAI 官方文档（platform.openai.com）中不包含 GPT-5，最新公开可用的前沿模型为 GPT-4o 及 o1/o3 推理系列。

Correction: 将 “GPT5” 替换为当时已实际发布的模型名称（如 “GPT-4o” 或 “o1”），或使用泛指如"最新的 GPT 系列模型”。

[Clarity] 本段内容密度过高，涵盖了 LLM 工作机制推测、鸭子理论类比、大模型作为搜索引擎的比喻、训练数据偏差，并引出"两个问题”。读者容易在信息流中迷失，尤其是作为本节核心的"两个问题"未能得到醒目的视觉呈现。

Correction: 建议将本段拆分为 2–3 个独立段落，让每个核心观点有独立空间。末尾的"两个问题"应使用编号列表或子标题突出显示，使其成为读者一目了然的结构锚点。

一来，无法保证AI输出的结果是正确的观点，而是占大多数的观点。但是大多数的观点，并不一定是正确的。即使你使用各种prompt，严格限制其输出方式，例如对每个观点都说明来源，承认不知道的问题，它还是会犯错。这种东西完全不能避免，很容易不小心陷入它的错误中。（因为我用Gemini 审查我的该网站的博客以及笔记内容，即使我设置了各种prompt限制其输出，它并没有照做——如果认为AI会按你的prompt来做，那就大错特错了）。这一点似乎可以通过对某个领域的所有知识进行专项训练实现，但是我没有体验过此类模型，也就不评论了。

二来，由于其不具有真正的思考能力，我感觉其不具备能做出开创性工作的能力，它或许可以进行排列组合，但是前人没有提出的观点，它是很难给出，这一点导致其似乎无法用于学术上的工作。

话又说回来，如果AI真能解决上面两个问题，感觉真的会有很多人失业了……

由此，现阶段AI最适合的工作感觉仍然是写代码，因为代码的核查，有其标准的规范。能不能运行，达到效果也是显而易见; 尽管可能代码写的有瑕疵的，但毕竟功能是能达到的，大多数项目对代码质量本身是没有太高要求的，只要能够达到功能就行。或者说，任何能够有规范流程评估AI输出正确的工作都很适合用AI解决，或者未来的工作也会聚焦到AI输出的审查规范的建立之上。

AI 下的创作

AI 对于很多进行文字创作——博客当然也算，是一个不小的冲击。以博客为例，现如今的很多技术问题，AI 都可以解决，写博客分享似乎已经没有意义，除非是真的很难解决的问题，但我想大多数人遇到问题AI足以应付了。当然，这对我也不算什么问题，因为我本就是将该网站当作笔记本，用于整理我的知识，本意也不是作分享所用——这也是该网站没有评论系统的原因。如果对于普通人还坚持创作的意义，我认为在于语言和意识的边界。单纯的思考很容易陷入原地，而创作则是激发思考一个很好的方式。语言每前进一分，思想便前进一分。通过语言的表达，能使得思想更进一步。

AI 的时代变革

AI 虽然存在一些问题，但是其好处是显而易见的，对于通用大模型不必多说。工欲善其事必先利其器，通用大模型不仅能提高工作效率，对于教育的变革是深远的。谁能拥有一个博学的博士无时无刻解答你的问题呢？对于小学到本科阶段的学习，我认为AI完全没有任何问题，且其水平超过大部分教师。然而，在专业领域的大模型才是更为强大的存在。以智能驾驶为例，国内正在推动L3的自动驾驶。在可预见的未来，所有车辆都会搭载智能驾驶，或者还会通过网络连接所有车辆的行驶数据，车网协同。这无疑会变革整个交通行业，以后的驾照的考取或许是没有必要的了，交通部门的任务也会改变。

[Clarity] “无时无刻” 在现代汉语中几乎总是与 “不” 搭配使用（“无时无刻不”），构成双重否定表示"每时每刻都”。单独使用 “无时无刻” 字面意思是"没有任何时刻"，与你想表达的"随时随地"含义相反。

Correction: 将 “无时无刻解答你的问题” 改为 “无时无刻不解答你的问题” 或更简洁的 “随时随地解答你的问题”。

[Suggestion] 本节将"教育变革"和"自动驾驶"两个主题合并在一个段落中，两者关联性较弱。建议拆分为两个子节（如 “### AI 与教育” 和 “### AI 与交通”），分别展开论述，让每个主题都能得到更充分的讨论空间。

使用 AI 的技巧

如果你想让AI 从头开始完成一个项目，或许应该先和它讨论具体的技术路线，最好是一个个小的单位能够组合其整个大的任务。然后根据讨论的路线图，将其拆分成一个个具体的单位让其解决。

如果你想让 AI 对现有的项目进行改进，则可以采用具体的形式验证，让其说出修改的东西，原因，以及参考来源，这有助于进行手动的验证。

当然最重要的是不要盲目相信AI的输出！！！

Last-modified in 2025-09-19