上一篇华为盘古大模型的内部自爆文章后配资正规网上炒股配资,作者的安危是自己十分担心的问题。
毕竟,有太多的前尘往事。
好在原作者最新更新了,肉身暂时安全。
各位好,
感谢大家的关心与祝福。我目前暂时安全,但公司应该在进行排查与某些名单收集,后续情况未知。
我补充一些细节,以免某些人继续颠倒黑白。
关于135B V2,小模型实验室在迅速地完成套壳并拿完所有套壳带来的好处后(比如任务令表彰和及时激励),因为不想继续支撑下游应用和模型迭代,又把这个烫手山芋甩给了四纵。确实技高一筹,直接把四纵的兄弟们拉下水。同事提供过去一个老旧的模型,最终拿回了一个当时一个魔改的先进的千问。做大模型的人,自己做的模型就像自己孩子一样熟悉,不要把别人都当傻子。就像自家儿子出门一趟,回来个别人家孩子。
盘古report的署名是不符合学术规范的。例如,135B V3有不少有技术贡献的人,因为作者名额数量限制,劳动成果没有得到应有的回报,团队内曾经有不小的意见。这个模型当时是大家智慧和汗水的结晶,甚至是团队当时的精神支柱,支撑着不少兄弟们继续留在诺亚。所谓的名额限制,以及挂名了一些毫无技术贡献的人(如一些小模型实验室的人),让兄弟们何其心寒。
暂时平安。另外,支持我勇于说出真相的战友们
前两天火车停半道,一车人闷热难耐,最后一个男人打破了车窗。
所有人都呼吸到了新鲜空气,但没有多少人记得支持打破车窗的男人。
那个孤独的男人,是个孤勇者。
b站上很多年轻人都喜欢这首歌,有很多翻唱,比原唱都出彩。
但现实生活中,孤勇者没几个,有也得不到众人的明牌支持。
就如同让子弹飞里,张麻子威逼利诱都只能赢得一群走地大鹅的支持。
另一边,针对华为盘古团队的领导檄文也出来了。
感觉有种星星之火可以燎原的味道,刻板印象里木讷的码农,也学会了写文章。
效果不会比宋江酒后吟诗差。
只是,唯一的一个缺陷,还在保持沉默。
前段时间阿里怨妇万字长文出来后,马云还是很体面大度的回应了一句:以后欢迎回来。
马云的弟子能落个体面,那任正非呢?
恐怕此时正在被公关摁着嘴。
以下贴出是部分讨贼檄文
文章license和Qwen一样,apache-2.0。
讨贼王云鹤檄文
因此,很多声音认为其所谓的“内斗”在大厂是再正常不过的一件事,这件事也不例外。我窃以为是完全不正确的。我知道很多人不齿华为国产化的路线,认为其是“行业百草枯”,但我们可以从大的角度看一下这个问题。
华为诺亚方舟实验室下的大模型团队,大部分是才华横溢的香港、985和海归博士,以及部分动手能力极强的硕士。进入大模型时代,其核心使命除了训好各类的语言、多模态理解和生成模型之外,还肩负着硬件国产化的使命,其团队全部的语言模型训练,都有严格的“只用昇腾”的规定。这一规定,从公司的角度讲,是希望纯昇腾训练模型的效果能被大众认可。然而,王云鹤及其团队不但技术水平低下,且极为急功近利,无视国产化使命,无组织无纪律,在项目的大部分时间公然使用英伟达的芯片训练模型。
搞过算法,接触过AI模型训练的人都知道,昇腾芯片环境需要大量的配置,唐睿明、尚利峰团队——“真正的盘古团队”,从2023年初开始踩坑,排查并升级了mindspore, 昇腾芯片等一系列国产化软硬件协同时的问题。他们的同学、朋友此时可能因为使用非国产化芯片而快速积累认知,快速成长,从而在人才稀缺的大模型市场有了很多更好的待遇和机会。
但他们却选择沉下心来,陪伴昇腾、陪伴PanGu一整套小米加步枪的训练基建,一起成长,只为了搞好自己的大模型,无论从哪一个角度讲,无论,这都是对国产化,对自主可控模型训练功不可没的贡献。
在其他团队在项目开始阶段频频踩坑时,王云鹤充耳不闻。在其他团队有些成果的时候,王云鹤闻味而来,企图先用“词表巧换技”占据先机。在某天才少年向姚骏(时任诺亚方舟实验室主任)指出王云鹤的小模型实验室开始套壳的时候,王云鹤对他说“你不愿意在这待着你就滚”。在王云鹤彻底成为诺亚方舟实验室主任的时候,他野心毕露,开始疯狂宣传其“小模型实验室训练出的超级大模型”,向领导邀功,向诚实的AI学术研究人员们秀其敝帚。
此外,在学术界,王云鹤抱着Dacheng Tao的大腿劣币驱逐良币,操纵NeurIPS论文审稿使其“水货”文章被录用。并主导引进了Fisher Yu这一劣迹斑斑、PUA女学生致死的所谓计算机科学家来诺亚当吉祥物。矛盾的是,却极为喜欢用论文来“秀肌肉”,被其发论文的Pangu Ultra MoE模型,其中的核心算法技术全部来自于唐睿明、尚利峰团队,但是测试却使用了套壳的模型,导致指标“几乎和DeepSeek一模一样”,完全是“彼之金玉,装吾之敝帚”。
王云鹤,就是诺亚方舟实验室里的祁同伟,他因为给人家捻发票捻得好手眼通天,有恃无恐。村里的野狗,都能被他拉来当警犬。这完全是一起有组织、有预谋的窃取“真正的盘古团队”的胜利果实行为。
王云鹤此刻在内网,仍不认罪,且拒绝正面回答一切问题,并称其“独特的训练技巧”经过了领导的决策。他对上没有担当,同时仰仗其他团队的成果却毫无尊重。另外,值得注意的是,他在内网完全否认718B存在强行赛马的事实,也不正面回应套壳,即“不存在两个718B”。
因此,王云鹤及其小模型实验室团队,其剽窃套壳行为必须受到审判。其小模型实验室中所有不学无术、只想摘果子的成员,势必要被钉在中国大模型发展的耻辱柱上,遗臭万年。
回应
关于135B dense模型指标的质疑:https://github.com/HW-whistleblower/True-Story-of-Pangu/issues/317:
此报告撰写过程中,王云鹤已然上任(理智的人可以分析arxiv报告上载时间)。与Pangu Ultra MoE完全一致,在文章攥写过程中,可笑的是,大部分被挂名的、实际做事的被列为Contributor的研究者,在论文撰写过程中对其存在、进度全然不知。其只挑选了唐睿明、尚利峰团队的一小部分成员对其倾囊相授,将所有问题、技术点等凝练成文中方法及之前的部分。而对于模型的实际效果和测试集表现,小模型团队大包大揽,唐睿明、尚利峰成员几乎全然不知,或者是被剥夺了抗议的权利,最终导致报告中列出了假到极致的训练测试集后的结果。
与尊重学术道德的DeepSeek团队不同,理智的人可以仔细搜索作者名单每个人,这篇文章的Core Contributor几乎全是领导,而不是实际的技术人员,文章作者共有52位,源于王云鹤和某领导沆瀣一气,得出的**“幸运52”**这一决策,可谓恬不知耻,毫无学术道德。
陆续也有他人回答,此处可以参阅issue区
从匿名、AI生成等角度,无脑喷之前论文和这个仓库的所有人。我建议你们试试,如果你家里有着家属和孩子依靠着你从事的这份工作,你能不能和《让子弹飞》的六子一样,切开肚子给人看看你里面有几碗粉?
——正道的光——
“如果天空是黑暗的,那就摸黑生存;如果发出声音是危险的,那就保持沉默;如果自觉无力发光,那就蜷伏于墙角。
但不要习惯了黑暗就为黑暗辩护;不要为了自己苟且而得意;不要嘲笑那些比自己更勇敢热情的人们。
我们可以卑微如泥土,但不可以扭曲如蛆虫。”
舆论这个舞台, 正义不发声,就会被歪理邪说占领。
觉得文章还算正常的话,欢迎点赞、关注、转发、在看,让正常的声音占领广场,耳根子也能清净会,世界也会更好一点点。
免息配资提示:文章来自网络,不代表本站观点。