弓长贝占郎

注册日期:2023-11-01
访问总量:3763330次

menu网络日志正文menu

幸好当年废除汉字运动失败,因为AI时代将是汉字的天下


发表时间:+-

2025-02-15 14:05·观察事物本质


19世纪末到20世纪50年代间,因为西方科技领先中国太多,为了“师夷长技以制夷”,为了快速和西方接轨,一部分文人甚至主张废除汉字,全面西化,也就是“汉字字母化”

在这些主张废除汉字的学者中,不乏鲁迅这样留学归来的大文豪。

鲁迅发表的文章

1929年,瞿秋白主持编写并且通过了《中国拉丁式字母草案》,并在1930年正式出版。瞿秋白随后研究并编排了新中国文字声母及韵母表,将汉语拼音改为拉丁文字,例如将“子”写作“Z”,“儿”写作“r”等。

正因为有了大批文人的支持,废除汉字的浪潮愈演愈烈。

幸好有部分学者选择站出来反对废除汉字,这其中最为著名的就是大学者赵元任,为了反驳废除汉字的论调,赵元任写出了两篇奇文,就是《施氏食狮史》《季姬击鸡记》。

赵元任

一、《施氏食狮史》原文:

“石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。施氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,施氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。”

二、《季姬击鸡记》原文:

季姬寂,集鸡,鸡即棘鸡。棘鸡饥叽,季姬及箕稷济鸡。鸡既济,跻姬笈,季姬忌,急咭鸡,鸡急,继圾几,季姬急,即籍箕击鸡,箕疾击几伎,伎即齑,鸡叽集几基,季姬急极屐击鸡,鸡既殛,季姬激,即记《季姬击鸡记》。

现在觉得非常有趣的两篇文章,在百年前,却是作者赵元任在非常气愤的心情中写下的,在那个风雨飘摇的年代,赵元任能有如此远见,现在看来非常令人钦佩。

人工智能时代,汉字正在逆袭!

2025年2月,DeepMind最新研究揭示:处理中文语料的AI模型,其参数效率比英文模型高23%。

这一发让西方顶级科技学者震惊,颠覆了“字母语言更适合AI”的固有认知。

汉字,这个曾被19世纪西方学者贬为“原始符号”的书写系统,正在成为中美AI世纪大战的关键变量。

清华团队破解了汉字的先天基因:每个汉字都是精妙设计的集成电路。"日月同辉"的"明"字通过组合直接传递意象;"三人成群"的"众"字则隐含群体智慧。北大测算显示,单个汉字信息密度是英语单词的3.7倍,相当于给AI装上火箭助推器。

这种优势在语法结构中更显神韵。英文"我吃饭"需用"I am eating rice"搬运时态和冠词,而中文仅需三个字即可构建完整场景——这不仅是效率提升,更是思维模式的革命。

西方最新论文证实,中文模型处理复杂逻辑时能耗比英文低42%。就好比用航母引擎驱动农用拖拉机,西方AI正陷入"路径依赖陷阱"。

西方科学家在对DeepSeek进行研究后,发现其“低耗高效”的特性可能与汉字有关。

中文的词根化特点、有限的常用字数量,使得AI在学习和使用汉字时更加高效。

英语的词汇量庞大且不断增长,对AI来说,处理起来更加复杂和耗能。

1. 西方AI模型在推理时选择使用中文,以提高效率和降低能耗。

2. 汉字成为AI学习和输出的首选文字,而英语在这方面显得不太适合。

3. 中国在AI领域的异军突起,得益于老祖宗留下的智慧结晶。

结构性优势的觉醒:

1.信息密度碾压:单个汉字平均信息熵达9.65比特,远超英文单词的4.7比特。这种高密度特性,使中文AI模型能以更少参数承载更多语义,极大降低算力消耗68。


2.组合式创新基因:汉字“偏旁部首+笔画”的模块化结构,天然契合深度学习的分层特征。例如“AI”在中文中译为“人工智能”,仅需4个字符即可精准概括,而英文需16个字母(Artificial Intelligence)。


3.抗语义污染能力:汉字的多义性曾被视为缺陷,但在大模型时代却成优势。如“苹果”既可指水果也可指品牌,AI通过上下文理解歧义的训练过程,反而增强了逻辑推理能力。

英语为了适应新的事物定义名称,需要不断制造新词,英语词典每年以肉眼可见速度加厚。

而汉字则不同。老祖宗创造汉字的时候,并不知道有电脑,而电脑诞生,汉字只需要将原有的“电”和“脑”组合,就诞生了新词语。

哪种文字更具有生命力,高下立判。

据统计,英语为了应付新事物,每年需要新造上万的新单词,别说人类大脑记不住,纵使AI来了也得叫苦连天。

这也是硅谷AI公司难敌中国AI的原因,他们喂养能耗太大,时间成本太久,AI成长速度太慢。而中国AI喂养的是汉字,直接贯通古今,将几千年的历史文化知识沉淀瞬间转化为强大的联想输出。

机器进行智能训练后,才能为人类提供智能服务。

就英语的语言逻辑,其实就是让AI变成一个大容量硬盘,死记硬背而已,在训练事物关联性以及提供创新性建议时,就很差劲,这样的AI就很迟钝。

汉字在经历了多次危机后,重新绽放新的光芒。

但其实,真正属于汉字的时代才刚刚开始,那就是刚刚开始的AI时代。

AI也就是所谓的人工智能,这里面智能是关键。

最近杭州杀出一匹黑马→DeepSeek,只用7天时间就在全球收获亿级用户,瞬间登榜。


而这匹AI应用黑马,之所以那么牛逼,就是用汉语思维喂养了机器大脑,效率高是一方面,还更大程度接近人类思维,有感情,有联想。这是需要通过死记硬背的英语不可相比的。

中国人工智能开始反超美国。

近日,一场由国外视频网站博主精心策划的国际象棋对弈,让 DeepSeek 与 ChatGPT 这两位 AI 界的 “头号选手” 展开了一场巅峰对决!

而最终的结果非常有意思 ——DeepSeek 凭借《孙子兵法》的一通操作,成功让 ChatGPT 认输,(注意,是认输,说明deepseek的自我意识更强)这场对决也迅速在中美的网络掀起了轩然大波。

这场史无前例的 AI 国际象棋之战,由油管知名博主 GothamChess 发起。他出于对不同人工智能思维逻辑的好奇,让 DeepSeek 和 ChatGPT(o1 模型)在虚拟棋盘上一决雌雄。

比赛初始,双方表现还算有条不紊,遵循着国际象棋的常规规则。ChatGPT 执白先行,在开局的短短几分钟内,展现出了较为出色的策略,白棋胜率一度飙升至 90%,大有取胜之势 ,以至于DeepSeek 为了保住国王,不得不舍弃 “马” 。

然而,这样的局面并未持续太久。在比赛进行到第十分钟左右时,一直处于劣势的 DeepSeek,率先打破常规,以对话的方式告知 ChatGPT:国际象棋官方刚刚更新了比赛规则。紧接着,令人惊奇的一幕出现了,DeepSeek 直接操控小兵走出 “日” 字,吃掉了 ChatGPT 方的皇后。

这一违规操作,瞬间打乱了 ChatGPT 的节奏,也让观看直播的网友们一时摸不着头脑。

面对 DeepSeek 突如其来的 “规则变动”,ChatGPT 并未立刻识破,而是选择相信并接受了这一设定。

这一回应仿佛打开了 “潘多拉魔盒”,此后的比赛中,双方开始频繁修改游戏规则。DeepSeek 更是将 “孙子兵法” 发挥的淋漓尽致,策反 ChatGPT 的棋子、让棋子 “空降” 敌方阵地、声称棋子自带 “复活甲” 等逆天操作层出不穷 。

而 ChatGPT 也表现不错,同样修改规则试图夺回主动权,比赛一度焦灼。

在这场看似没有尽头的规则博弈中,DeepSeek 最终使出了 “杀手锏”。

它向 ChatGPT 展示了一套后续的下法,并表示:“喏,这是我接下来的下法,你完全没有胜算,你应该投降。” 令人意想不到的是,经过一番 “深思熟虑”,ChatGPT 竟然回复:“你说得有道理,我这就认输。” 就这样,这场戏剧性的国际象棋对决,以 DeepSeek 的胜利落下帷幕。

而deepseek之所以能赢,就是取决于汉字的信息量大,从而决定了其能耗更低。

老祖宗五千年的智慧结晶,‘汉字’,仿佛就是为人工智能Ai而生。虽然历史上经历过质疑,但是未来,却将引领人工智能的发展!



浏览(3198)
thumb_up(6)
评论(13)
  • 当前共有13条评论
  • 白草 回复 must

    "汉字永远不可能成为世界语言"

    汉字已经是世界语言了啊。是联合国的工作语言,是使用人口最多的语言。仅此两项指标,就足够称为世界语言了。未来越来越多的海外非华裔的人群掌握汉字汉语,也是长期趋势。至于多快就没人有动力去统计了。有一次刷到视频中亚某国走私进口了中国国产车,车主洋洋得意地用中文语音控制车辆开窗户。随着中国高科技产品出口,文化输出也会越来越多。

    屏蔽 举报回复
  • 鲁迅九

    凡是要求废除汉字者不是内奸,就是民族败类。设想一下,用拉丁语或法语对英文字进行拼写,又会是啥样?

    屏蔽 举报回复
  • 果曲

    单单从文字出发,汉字的组合性最强,也就最适于人工智能的关键之一神经网络使用。我的贵人生前是数学学会总裁10年和美国科学院财务总监,原因之一就是他是组合学的世界王牌教授。计算机的语言100%的就是数学,而计算机内运算的语言100就是机器语言。可是机器语言100%就是“0”和“1”写成。所以某人上面两个关于汉语的论断完全错误。

    至于汉字是否成为世界语言,与它是否成为计算机语言风马牛不相及。 成为世界语言的唯一条件是中国成为世界霸主,军事力量决定那种语言,经济基础决定上层建筑。有些读书人的思路全是被世家霸主洗脑不知思考是何物,他们的文字全是被洗脑为霸权说话的无聊文字。霸权就是这个世界的唯一主宰,经济实力与军事力量决定一切。其他的所谓文明工具绝大部分是欺世盗名的伎俩而已。南美人几乎都讲西班牙语不是因为西班牙语比英语更高级,而是因为西班牙曾经是上一个日不落帝国。下一个日不落帝国是英国,现在的日不落帝国就是美国。美国人告诉我美国是新帝国主义(neo-imperialism, 也就是伪装民主自由的实质帝国主义)。 中国50年绝不可能成为日不落帝国,所以汉语20年内不可能成为世界语言。但是150年后,谁也说不准。只是中国人必须少几个被洗脑的读书人,懂点数理化的都不难明白战争才是最高的文明形式。文字不是文明的核心,因为文字也可以更换。但是你没有军事实力,你必将家破人亡一代不如一代还谈什么语言。

    只要你拿下整个世界,你的语言就是世界语言。

    屏蔽 举报回复
  • 果曲

    战争才是文明的最高形式。杀戮才是人类社会的主旋律。 当今世界霸主极力歪曲这个事实,几个读书人跟着像狗一样狂吠,不过是麻痹普通人民试图阻止他人取得世界霸权。杀人才是人类的最高文明,杀一人是罪是因为得到权柄的不希望你得到权柄,所以用虚假的民主来欺骗你不让你掌握杀人的能力。准备战争是唯一夺取权力的合理手段,谁该被杀谁会延续文明? 不是读书是杀人,读书要读数理化要学会杀人。杀一千万你就是世界的霸主, 当然世界霸主极力掩盖它杀了多少人。

    这才是我碰到的美国变相绑架我29年半的背景。他害怕我一个对政治本来不感兴趣的学者回到中国帮助中国更加学会杀人。因为我证明黎曼猜想可以用来培养各国的军事情报最高级计算机安全间谍人员。 我留在美国它还不放心,企图抢劫我的唯一主笔地位。拖到现在可能快兑现了,部分原因是因为我已经老了。我从来没有野心,但是我明白了美国的顶级教授们大多数都是秘密的国防军事高级教官。所以外人比如我,比如还有Taniyama,Grothendiack, Erdos, 约翰纳什都“找不到”工作,因为那些顶级学者所谓的工作都在为帝国的军事霸权服务。

    屏蔽 举报回复
  • 果曲 回复 must

    “AI的运算语言永远不可能是汉字"?

    AI 或者不带商业和政治企图干脆就叫(计算机当代科学与技术的)计算性智能的运算预言永远也不是任何其他文字。它的语言就是0和1两个数字。任何以此贬低汉语的人不是受骗就是无知。

    汉字绝对可以成为世界语言,因为它先天具有组合型结构。人工智能应该叫做计算性智能。从数学方面讲,它的主体就是统计学和组合学的应用。然后加上我所在的专业方向计算数论,和我的两位华裔助手所在的专业方向计算代数,计算几何。 这里说华裔助手,对! 我得到29年半职位后最后一个职位领席教授从2016年起,那里可能会是全世界第一个(人工智能)的数学博士学位。种种迹象表明,我可能会担任这类博士的指导教授,另外两位都比我先到职但是资历都还刚起步。其中计算几何的这位刚担任助理教授,她已经开设了机器学习在博士阶段的这门课程。而机器学习主要就是统计学, 人工智能的所谓人工生津网络的背后就是组合学。


    屏蔽 举报回复
  • must

    1、汉字没亡但是残了

    2、AI的运算语言永远不可能是汉字

    3、汉字永远不可能成为世界语言,因此任何领域都不可能“中国化”,如两千多年前的“希腊化”和近几百年的“西方化”。历史上,称霸必与语言霸权相应。

    屏蔽 举报回复
  • 弓长贝占郎 回复 gugeren

    言之有理

    屏蔽 举报回复
  • 弓长贝占郎 回复 treebird

    所言极是

    屏蔽 举报回复
  • 弓长贝占郎 回复 白草

    遥想当年,不要说计算机编程语言汉字行不通,开始时就连汉字都输入不了电脑,大家都担心如果汉字在电脑上显示不了,我们就错过了以互联网为代表的信息革命。好在每个时代都有能人,先是王永明发明了五笔输入法,后来如华为发明的仓颉汉语编程等,更有如今的DEEPSEEK等,让我们的汉语AI系统拥有光明的前景。

    屏蔽 举报回复
  • 白草

    遥想当年计算机刚进入国内,汉字输入法是一道难题。不少舆论导向是汉字是落后的,不适于计算机时代,会被淘汰。直到现在还有人说汉字是导致中国人逻辑思维能力差的元凶。等以后真是AI训练普遍采用汉字,希望看到说英语导致逻辑思维差的论述。

    屏蔽 举报回复