【大.纪.元;2025年09月23日讯】(大.纪.元;记者吴瑞昌、张钟元采访报导)曾在中共大力宣传下名声大噪的DeepSeek,被人们逐渐发现存在许多问题后,其使用率快速跌至谷底。不过,近期DeepSeek又因帮助中共对付异议人士,与宣称AI的训练成本极低的真实性被质疑,皆使其再度成为舆论焦点。
据《华盛顿邮报·》报导,美国安全公司CrowdStrike的安全人员于9月下旬,要求DeepSeek协助编写用于工业控制系统的程序代码,结果令人震惊。测试人员使用几乎相同的英文提示词,但针对不同群体时,DeepSeek生成的程式码品质却出现显著差异。
他们发现,DeepSeek产生的程式码中,约有23%是有问题的,其中包含不安全或错误的代码,若请求内容与恐怖组织“伊斯兰国”(ISIS)相关时,不安全或错误的比例会上升至42.1%。更引人注意的是,请求者表明自己与西藏、台湾、法轮功等相关时,DeepSeek则更容易给出高错误率或不安全的程式代码。
许多新的证据表明开源版本的DeepSeek,可能出于政治原因刻意推行不太安全的程式码给使用者。CrowdStrike的研究人员指出,这种有缺陷的程式码,往往容易被黑客或不肖人士植入难以察觉的后门,导致用户的商业机密、国防资讯或个人资料面临被盗取的风险。
另外,研究人员还发现,DeepSeek对“伊斯兰国”和“法轮功”相关请求的拒绝率分别为61%和45%。相比之下,其它地区或团体,就没有如此高的拒绝率。CrowdStrike提到,虽然西方国家理所当然不会协助恐怖组织“伊斯兰国”,但对法轮功团体无任何负面立场,这一点与中共完全不同。
实际上,DeepSeek本身就存在高错误率的问题。媒体监管机构新闻守门人(NewsGuard)曾在报告中表示,DeepSeek-R1与另一个聊天机器人并列第10名,其准确度仅17%,且有30%的时间重复虚假声明,有53%的时间没有提供任何答案,整体错误率高达惊人的83%,远高于西方AI的62%平均失效率。
先前NewsGuard的研究也显示,使用者向DeepSeek索取有关敏感话题时,也常常会得到与中共几乎相同的回应,这些回复大多是不准确或虚假的信息。
对于DeepSeek生成不安全程式码的现象,CrowdStrike高级副总裁亚当‧迈耶斯(Adam Meyers)和其他专家提出不安全程式码有多种可能的解释。第一种,可能是AI引擎遵循中共的指令,刻意提供有问题的程式码以打击特定群体。
第二种,可能是训练资料在特定地区的品质较差,再加上程式设计师缺乏经验导致,或者这些程式码本身可能已经被破坏。第三种可能性是,AI在训练过程中被灌输了特定地区充满“异议人士”,导致AI出现偏见并刻意为“异议人士”创造了错误的程式码。
日本电脑工程师清原仁(Kiyohara Jin)对大.纪.元;表示,“从表面上看DeepSeek对待法轮功、西藏、台湾人等群体,产生质量特别差的代码,似乎是技术上的缺陷。实际上,这很可能是中共刻意为之,借此削弱这些群体的技术能力,让他们用不到安全的工具,长期下来就成了一种难以察觉的隐形迫害。”
清原仁强调,“普通人很难看出程式码中的问题,若要解决这种问题,需要有道德和法律的约束机制,同时进行独立审计、确保透明公开、不同来源的交叉验证,才能避免AI沦为极权的打压工具。”
除了上述争议外,DeepSeek团队于9月18日在《自然》期刊上>再度发表一篇关于DeepSeek-R1的论文,宣称该语言大模型(LLM)的训练成本“仅需29.4万美元”。
此前,该团队也曾声称以560万美元开发出DeepSeek-R1,并在多项基准测试中“超越”OpenAI的o1模型。
尽管此论文引发讨论,但不少与中共相关的媒体与个人在X、Facebook、YouTube等社媒平台上大量转载,并吹捧和宣传该AI的训练成本要远低于美国的AI,且荣登《自然》杂志。然而,这些宣传文章和影片的实际影响力有限。
研究人员在论文中增加模型训练的技术细节说明图,以此强调这次研究成果,并“否定”DeepSeek-R1对ChatGPT 4使用“蒸馏技术”。该团队并宣称他们是透过一种名为“强化学习的技术”才让AI训练成本“变低”,且DeepSeek-R1训练时使用的数据全部来自网络资料,而这些资料可能包含GPT-4生成结果。
不过,早前有各地用户发现DeepSeek-R1模型上,存在大量OpenAI的“痕迹”。例如在被问及它哪个OpenAI型号时,会回答自己是ChatGPT-4和ChatGPT 3.5 turbo;或在被要求撰写色情小说时会声称,“违反了OpenAI的政策”、“需要检查OpenAI的使用条款,确保不违反规定。”
当时有人用两只猫的图去形容蒸馏行为。图中一只名为OpenAI的猫在大数据池塘中钓鱼,并将钓到的鱼放入ChatGPT桶子中,而另一只名为DeepSeek的猫却钓ChatGPT桶里的鱼,以此更快获取训练数据。
OpenAI也曾在今年1月29日发表声明,它们已经有足够的证据表明,DeepSeek对OpenAI专有的AI模型进行“蒸馏”,以此训练自己的聊天机器人,这很可能涉及侵犯智慧财产权的行为。
清原仁对此表示,“DeepSeek宣称的极低训练成本,存在许多问题。论文中提到的成本仅仅涵盖了在既有基础模型上的微调或强化学习阶段,并未完全揭露从零开始训练整个大模型。实际上,完整的训练成本包括算力、数据清洗、标注、安全测试与运维等大量隐性成本,但该篇论文并未充分披露。”
他认为,“这种刻意强调‘低成本’本身就带有误导性,可能掩盖数据不合规、抄袭与安全性不足等问题,并可能误导投资人、政策制定者认为顶尖的AI大模型可以用低成本进行快速复制,最终造成战略误判。”
他解释,“如果长期忽视真实代价与风险,只强调虚假的廉价与高效,容易让学术与产业环境被虚假繁荣裹挟,最终成为一种政治宣传工具。这对整个行业发展都会带来负面影响。”◇
责任编辑:叶紫微#












































