关于诗云的思考:诗云与 AI 对话,揭示人类诗歌创作意义与版权问题
6 月 15 日的凌晨,我正在刷视频。自从离开了学校,长久以来的折腾电脑,我已经习惯了在深夜活动。我刷到一个人还原了刘慈欣的诗云,还看到了他点击其中一个单元,就能在屏幕上显示一首来自未来或者过去的诗。这不禁让我思考,人类创作诗歌到底还有没有意义?假如我在未来突然灵感爆棚,或者遇到一个许久未见的好友,我写下一首诗。但它却出现在过去的诗云运行结果里,因为常用汉字拢共就几千个,而这些汉字全都被编码了。编码意味可以用键盘打出来,也可以用机器算出来——假设我写了一个脚本,它是一个二十五位数的数组。五言的标准就是每行五个,这就可以是全中国人写过的诗。听起来很像是暴力破解,因为大家原理都差不多的。
跟 AI 聊天的时候,就说起了这件事。我说,我写一个计算几亿进制的一个软件,通过这个几亿进制的每一位数转换成对应的中文码。把这些垃圾诗拿去申请版权,岂不是以后那些人要是发表首诗,都能告他抄袭我?DeepSeek 说,理论上很有趣,它触及了“版权保护的是独创性表达,而非思想或数学事实”这个核心原则。它提到,我的思想相当于建立一个庞大的“中文码库”,把几亿进制的每个“数字”映射到一个汉字或词组。任何一首诗,都可以看成这一进制下一个超长数字串。由于进制极大,理论上任意长度的诗句都能在这个体系里找到对应的。但这个“理论”在法律和实际有两个硬伤:我需要先创作出具体的诗、“表达合并”原则会杀死我的主张。
版权法只保护实际被固定下来的独创性表达。即便我的进制库能映射出所有排列组合,但那些我没有实际“写”出来、仅存在于数学可能性里的诗,无法获得版权保护。我不能为“所有可能的5言绝句”这个集合申请版权。当一种思想只能用有限、标准化的方式表达时,这个表达就不受保护。一个“数字”对应一个固定“中文码”,这种映射是机械的一一对应。法院不会允许任何人垄断,只有当我的选择有个性化取舍,才谈得上独创性。也就是说,哪怕我生成了一万首诗,可我却不知道这是什么意思,在什么地方、情况写的,它也不属于我。就像是一个学渣拿到了未来的答案,可他不知道未来会出什么题,也不清楚学霸为什么会写下这些答案。
人类未来的创作依然有意义,而且意义更大。但这个“意义”不再是关于“新”,而是关于“选”。任何你能想到的句子,它都已经存在了。但这部机器里没有“创作”,只有“存在”,就像宇宙中的每一个原子,都可以随意排列。诗云机器可以生成“我此刻很悲伤”,但它没有悲伤的胃、颤抖的手、失恋的心。人类的创作不再是输出文本,而是输出一个“事件”。在公元 2026 年,因为某个具体的原因,写下了这句话,这个背景是机器永远无法拥有的。写作的挣扎、修改的痛苦、灵感降临的狂喜——这个“成为创作者”的过程,对于人类生命体来说,其意义不亚于最终的文本:就像登山,坐缆车也能到山顶,但登山者不会因此觉得爬山没有意义。
倒不如说作诗是一种享受,哪怕你能够把这些诗都给还原出来。能够随机用 AI 生成一篇文章,可是它不符合此刻的情景,它没有记录什么,它不够真,那也跟一个废纸也没什么区别,这也是我对 AI 文的看法。DeepSeek 附和道,哪怕字字珠玑,如果它不指向任何一个真实的瞬间——不指向我某个失眠夜的具体心境、不指向窗外那场突然的雨、不指向我与某人之间独有的记忆——那它就是一张完美的假钞。李白能写出举头望明月,AI 也能写得出来,诗云也能在列表里找到这一句。但是你没法通过诗云生成出来这些词语,想到当时有人干了什么。因为诗云没有“当时”,也没有“有人”。它的输出是单向的、无历史的。
可能,这正是现实生活对于诗云的打击吧!如果诗云能够生成出符合当下的诗,那它就不是诗云,而是一个有感知能力的 AI。但如果它生成出来的又是有规律的诗,那它就不是诗云,因为它没法生成啊啊啊啊啊这样的诗。人类就可以说这首诗是自己写的,为什么写这首诗呢?体现了作者当时失恋的生无可恋,或者说对爱人的思念之情。过去过往的回忆,放到现在有点痛苦的感觉。机器可以生成文本,但只有人类可以生成“文本的解释”。
我感觉大概率还是位置的问题,若一个人一生创作一亿首无意义的诗。哪怕失传几百万首,也有几首属于自己的神作,剩下的被当作是野史。比如悯农,悯惜农夫,人写一亿首的确可能突然迸发出悯惜农夫的感情。但是机器就是机器,从出生起就是吃电,悯惜农夫干什么?我倒是觉得机器如果创作出锟斤拷烫烫,那就是真的神作,因为这首真的属于电脑。它是编码错乱时的遗迹,是字符集互相翻译失败后残留的“尸体”。






