我决定重新看待个人网站这件事。这不是一个突然的念头,而是一系列事情堆积之后,自然落下的一个句号。前几天我打开 Cloudflare 统计后台,发现大部分访问者用的还是 HTTP 1.1 或者 HTTP 2.0,HTTP 3.0 寥寥无几。我的网站在中国、美国、荷兰、新加坡、德国都有访问,中国更是有 3996 次。

数据看着很惊喜,但我好像在那一个瞬间明白了什么。我说不清楚,只是觉得那些数字背后,好像不是我期待的那种东西。我尝试在各大搜索引擎搜索(必应、百度,国内就这两家)自己的名字。出来的不是我的网站,翻页也找不到。只能搜到和我名字差不多的人——有的来自某科学院(梁栋)、有的来自某三甲医院(梁栋)、有的来自某公司的专利申请页面(汽车专利,梁栋烨)。

但就是没有我的个人主页,我尝试直接搜索自己的域名。结果排在第一位的是我之前用这个域名搭建的旧站,链接早就失效了。搜索引擎记住了我的过去,却无视了我的现在。那个失效的链接像一个幽灵,比我亲手搭建的新主页更有权重,仅仅因为它存在得更久。我去微软站长工具看了 Sitemap 的抓取记录,明明几天前还有爬虫自动抓取。可我就是什么都找不到,仿佛这些爬虫从来没来过。

后来我求助 DeepSeek,它告诉我可能是被某些 AI 公司拿去训练模型了。HTTP 1.1 占了 46%,用户来源大多是西方国家——美国、德国、荷兰。我做的是中文内容,顶多是亚太地区的人会看,为什么西方国家会有那么高的访问量?因为那些 AI 公司的抓取服务器就部署在那里。它们不是来浏览的,是来批量下载的。

我的中文内容对它们来说是宝贵的非英语语料,无论我写的是博客、随笔还是个人思考,对 AI 来说都只是干净的、可用的、免费的中文数据。而这些爬虫不贡献索引,它们不通知 Google 或百度“这个页面很重要”。它们悄悄地来,打包带走,然后离开。人工智能给了我一个比喻,我觉得特别准确。它说腾讯、微软那些大网站,就像是百货大楼面前停了很多辆车。

我朋友的网站,就像是家门口停了很多车。而我的网站,就像是家门口停了很多辆不知道谁运来的烂单车,它们从我的家门口刮了一点墙皮,不留痕迹就走了。更可笑的是,我没法向法院证明我的家被很多流浪汉刮了墙皮,证明我的网站是有很多人访问过的。因为这些爬虫本来就不走合法渠道。我算了一下,它们赚了我的宽带费。

虽然我用的是 Cloudflare Pages 和 Cloudflare CDN,全都免费挡下来了。但假如我没有托管到 Cloudflare 呢?假如我的源站直接暴露在外面,那些爬虫的请求会直接打到我的服务器上,带宽成本由我承担。它们拿走我的内容训练模型卖钱,而我付账单。这不是比喻,这是很多个人站长真实经历过的事情。Cloudflare 是我的免费保安,它也让我和成本之间隔了一层。

我看到的是“缓存率越来越高”,而不是“源站被锤烂了”。如果哪天 Cloudflare 不再免费,或者哪天 AI 爬虫找到了绕过 CDN 的方法,那个账单会替我这些年所有的“免费”一次性结清。总有人问我,搞个人网站到底有什么用?域名只是你暂时租的,任何人都可以宣称自己出身在 2009 年 9 月 9 日,把自己的生日作为网站域名 090909.top,并且还觉得自命不凡。

任何一个犯罪团伙、黄色佬都可以在我域名不再续费后,花更高价把我辛苦运营一年、十年、五十年的网站变成从来没存在过,点进去就会有一堆不健康的广告弹出来。反倒是像我那个朋友一样,把自己的每一天写在纸上,放到冰箱里开启干燥模式,存储得久。他是这样说的:四十八块钱可以买好多个记事本,它们都可以是牛皮纸。当他伤心了,就在笔记本上写一条说说,心情好了就在里面写一篇文章。

如果哪天朋友要来家里做客,就把日记本打开给他们看,朋友们就会在笔记本上写上自己的名字和留言。这种东西,保存多少个朝代都不会坏!在那个朋友面前,我会笑着说,你还是太肤浅了。如果我的目的是为了保存,为了更好地记录自己,把自己活出主角,拥有一大堆现实朋友,那我肯定会和你一样,把它写在记事本里,放进冰箱里,周围放些樟脑丸。

作为一名一开始就是奔着自动化而去学习的编程爱好者,我当然可以写一个脚本,花一些钱把我的文章、字体、相册、评论甚至友链重新打印出来,成一本书。可是为什么我不一开始就买一本笔记本,而是搞个人网站呢?一切只是为了好玩。我朋友把个人网站当成一个工具——保存、记录、展示给朋友看。所以他用工具的逻辑来衡量:成本、风险、耐久性。他的结论没错,但前提错了。

我不是在找一个工具,我是在找一个游乐场。写脚本把文章打印成书,那是项目,不是游乐。把日记放进冰箱保存,那是仓储,不是游乐。担心域名被抢注变成垃圾网站,那是风险控制,而我在游乐场里根本不在乎围墙外的事。我学编程不是为了更高效地生活,我是为了好玩。配置 Cloudflare CDN,好玩。看后台数据猜流量来源,好玩。发现爬虫在偷墙皮然后生气,也好玩。

甚至和朋友争辩“个人网站有什么用”,本身就好玩。四十八块钱买一堆牛皮纸笔记本,那是消费。花四十八块钱买个域名,那是开始一场游戏。游戏不需要理由,游戏不需要保存多少个朝代,游戏的意义就在玩的过程里。他用了错误的坐标系来测量我,他在用“保存工具”的坐标系测量一个游乐场,当然测不准。如果有一天我的域名真的被抢注了,我会难过,但我不会后悔,因为好玩的过程已经发生过了。

我突然想到一个很荒诞的笑话。或许我比我的朋友“被保存”得更久。虽然那些 AI 公司在清洗数据时,会让模型忘了我叫什么名字,但是当某个操作员因为自己的不小心而让 AI 以我的口吻说话,还赞扬 AI 有了人性时,笑话反而在此处展开。那些 AI 可能分不清自己到底是王科文还是梁栋烨,又或是吴语涵、谭梦晴。

但那已经没必要了,至少对于那些 AI 公司来说,此刻的 AI 才真正有了“人性”,他们又可以发论文搞钱了。他们不需要分清我们是谁,他们需要的恰恰是“分不清”。分不清意味着你的独特性被溶解了。你的语气、你的思考、你的反讽、你藏在文字里的那个“你”——全都被磨成了均匀的粉末,和其他人的粉末混在一起,压制成一块叫做“人性”的砖。然后他们拿着这块砖说,看,我们的 AI 有灵魂了。

但灵魂从来不是混合物。灵魂是一个人看到某个东西时独有的反应,是只有自己觉得好笑的笑话,是写日记时某个细微的措辞选择。这些东西一旦被粉碎、混合、蒸馏,剩下的东西不叫人性,叫“人性感”——一种让投资者和读者觉得“像那么回事”的仿真材料。我朋友把日记本锁在冰箱里,至少他的名字还贴在封面上。我的文字被 AI 消化后,连我的名字都被洗掉了。他们发论文,他们搞钱,他们庆祝 AI 拥有了人性。

而我在个人网站里写下的那些东西,那些真正属于人的、细微的、不值钱的但独一无二的痕迹,变成了这场庆祝里不被看见的燃料。可是我还是会继续更新我的网站。不是因为我不知道这些,恰恰是因为我知道。我知道域名是租的,知道爬虫在偷我,知道搜索引擎找不到我,知道我写的每一个字都可能变成某个模型里的一个 Token 然后被忘记。

但我的网站不是一个保存工具,它是一场游戏。游戏的意义不在结局,在玩的每一刻。那些烂单车还在我家门口停着,还在刮我的墙皮。但这是我选的。我选了一个会被看见但不一定被认出、会被消耗但不一定被记得的方式,存在于这个互联网上。这不好笑吗?这太他妈好笑了。