好像是模型的训练出了什么问题,但这其中究竟发生了什么,程旭也没有过多的关注。
“千寻确实花了不少钱,投资也数十上百亿了。”
潘正没有否认程旭的说法,这些东西都已经是公开可求证的了,不过,随后他便微微摇了摇头:“但是现在有点儿,坏了!”
“坏了?”
程旭有些不解,坏了是个什么概念?有这个术语吗?
“难道是寒武纪受到限制,训练卡和推理卡都不能及时供应得原因?”程旭有些不解,这是有些影响,但按理说,这还影响不到当前的上线。
“也不是什么机密,稍微消息灵通点儿的人一打听都知道。”
潘正无奈道:“不是硬件的问题,寒武纪的问题影响暂时确实没有那么大,是‘言心’基础模型的问题。”
程旭更加不解了,基础模型能有什么问题?
都训练那么长时间了,数十上百亿的资金都投入进去了,基础模型有问题都没发现吗?
“这算是早期的一个小失误,”潘正解释道:“原本不是什么大问题,但现在确实不好解决了。”
程旭没有吭声,等着潘正的下文,他是越听越糊涂了。
“早期训练的时候,训练人员也没想那么多,那个时候也没有什么严苛的标准,就使用了自己的产品做语料……”
“自家的产品?”程旭眼睛猛地一跳,瞬间就想起来发生了什么事儿了——千寻自家的产品,除了搜索引擎,也就文库和贴吧了!
而对话,贴吧,这……
程旭瞬间醍醐灌顶——脑海中冒出了一大堆的名词:大帝吧,航空吧,人口吧,孙吧,中西部发展吧……
这……
用这些语料做得模型早期训练?
这T-M-D究竟会训练出来个什么玩意儿?
“卧槽!”实在是没忍住,程旭爆了个粗口:“不会训练出‘阴阳人’加‘乐子人’的‘言心’模型吧?拿他岂不是只会阴阳怪气儿,指桑骂槐?”
程旭摇了摇头,只是这样还是好的,真要培养出来一个类似“50w人格”的价值观出来,那千寻真的是哭都没地儿哭去!
这章没有结束,请点击下一页继续阅读! <!--20230412212821-->