第91章 数据基建(1 / 2)
会程结束后,一行人滞留西尼又游玩了几天,这段时间是难得的放松。
可惜欢乐的时光总是短暂的,除了孟繁岐和唐璜两位休了学的人,其他的四位仍旧有学业在读。
这次正常上课的时间,能和孟繁岐一同过来,已经是相当不容易了。
再拖延了几天,终究还得赶回学校,否则挂上三四科也不是没有可能。
孟繁岐有心提携身边人一把,但也不至于一路护送,让人本科也别念完,这个不现实。
这次带他们过来,主要是让他们见识了解一下AI界现在的情况和潜力。
准备继续留在国内的刘旭,麦芒和秦慧三人,孟繁岐自然是有着自己的安排和打算的。
他希望几人协助去做的最重要的事情,就是在国内建立一个优质中文数据库。
这个东西是未来中文ChatGPT能够取得成功最最关键的因素。
孟繁岐有信心凭借自己的能力把西方AI界的资源尽数收入囊中,但他却解决不了中文优质数据不足的这个根本难题。
这也是重生前,困扰华国诸多科技公司的最大原因,优质的中文数据远少于英文。
而优质数据就是AI时代的石油。
华国互联网起步晚,数据积累逊色一些是一方面,一个个都忙着在赚快钱则是另一方面。
这种白白投钱进去,收集数据,标注数据的脏活累活谁肯做呢?
为了中文和华国AI在四五年后的ChatGPT时代能够跟上节奏,这件事就只能由孟繁岐提前布局了。
这可是个黑洞一般吞噬金钱的大工程,一位员工的使用成本,一年少说就得十万块,招百来个人,一年过去就是数千万。
收获得只有一堆堆无情的数据,这件事情短期内不会有任何的营收。
四五年的长线,孟繁岐少说得砸三五个亿进去,如果想要数据的质量和规模上精益求精,十几个亿进去也不是没可能。
“还好跟谷歌签了分成合约,否则真不知道哪里去弄这些钱。”
孟繁岐感到了些许的压力,仔细计算了几笔账之后,他意识到自己想做的事情成本似乎远高于自己的想象。
给谷歌的推荐广告算法更新得尽快提上日程了。
“刘旭,麦芒,慧慧,情况大概就是这个样子。三四个月后,我会跟你们具体再联络,你们先负责帮我在国内弄好数据收集这件事情。”
机场,孟繁岐和唐璜要去一趟尚海,其余人则都是回燕京。
此次一别,以后见面的机会不会太多,因此孟繁岐交代了一下后面的大概计划,“这个数据收集的任务,你们不需要考虑营收的事情,不要有压力。这个公司的部门建设出来就不为了赚一分钱,营收的部分其他部门会去做,所有的支出我会负担,工资肯定不会少了你们的。”
让这几位同学先帮助自己打理一下数据的收集事宜,孟繁岐签了谷歌的大单,白度这里的分成就不准备再往美国去转了。
就留在燕京,投进去把中文数据的基建给做做好,不要做个绘图还得转成英文,闹出什么松鼠鳜鱼,胸有成竹之类的笑话。
“先做好数据的基建,等以后有了其他机会,我再跟你们细聊。”
这个AI公司肯定会和白度有些合作,孟繁岐准备借助自己的关系,从白度内部多搞点数据出来。
等他们几个有一些经验之后,跟随技术部门的人和白度之间来往锻炼一下,明年有其他和国内大厂技术合作的机会和任务再交给他们稍微承担一部分也不迟。