第172节(2/2)

说的人觉得挺有趣,说完还哈哈哈的笑。

安夏却从中想到了另一个的问题。

被那个贼偷走的书都是珍本,借阅都有门槛,属于想看的人看不到,有资格看的人不一定会去看。

随着时间的流逝,这些珍本也许本身会损坏,纸张变脆,字迹消失……那就太可惜了。

到时候,许多书也许就会出现大量丢字的情况。

后人都不知道那些字到底是犯了谁的忌讳变成的「口口」,还是当初出土的时候本身就是「口口」。

刚好此时在首都,安夏找到相关的??门,以美国的窃书贼案为由头,问他们是否打算把珍本善本孤本也电子化,方便保存和。

“想啊,但是扫描下来变成图,一张就占特别多的位置,我们现在只存了几本书,就已经挤满了十个硬盘。”

安夏问道:“我们公司的扫描技术已经可以把图里的字扫出来了呀。”

“用过了,能扫出来的只有印刷体,连行书都识别不了,古籍上的许多字上都有划痕,系统更认不出来了。”

难怪字体提取功能上线之后,免费版和收费版都跑得不行,没有出息的项目组以为这个功能过于超前,所以无人使用。

又因为他们甚至都没做客户登记,连这个功能到底有哪些单位在用都不知道。

最后散伙的时候,项目经理还发了一封公开信,大意就是:

世间皆是俗人,把吴钩看了,栏杆拍遍,无人会,登临意。

那时安夏也没空盯他们这个小项目,就随他们自由发挥。

哪个公司还不死几个项目的,习惯就好。

如今她才知道,扫描提字项目组的倒闭不是技术不行,是意识不行……

安夏自我安慰:算了,五根手指伸出来还有长有短,不能指望全公司上下全都是人精,再牛逼的公司也有翻车的时候。

记得这个项目组的一部分人辞职走了,另一部分人转行投奔了电子辞典的升级版。

安夏看了几篇古文原稿,发现肉眼识别的话,问题不大,正经流传下来的书籍和书信一般不用狂草。

最多就是有点扭动,有点划痕。

有一种熟悉的感觉。

安夏想起了验证码……各种登陆的时候,发言的时候,需要输入的中文、英文,还有识别图形。

人工智能,需要大量的人工对其进行引导。

人类在用肉眼识别图片,并输入正确字符的时候,就是对人工智能的一个驯化过程。

“能不能把比较难识别的一些古本扫描图给我们,我们会让计算机学会识别这些字的。”

“计算机?识别这些字?”古文专家觉得安夏在说天方夜谭。

“是像《编辑部的故事》里那个人工智能一样吗?”

安夏笑道:“不一样,那个人工智能是人装的,我们这是真正的计算机人工智能。”

“它要怎么识字?”古文专家还是想不通。

安夏跟他说了一通算法、线性回归、计算树以及等等……古文专家露出安夏与阿昕聊天时,听「转录、变异、xx链」的表情。

最后他的反应也是安夏熟悉的:“啊——原来是这样!太厉害了,那我就期待着你们的好消息。”

自从年会的时候,安夏当众宣布,要无条件支持人工智能项目组的时候,技术总监心里又感动,又有压力。

老板这么给面子,要是不干出点样子来,怎么对得起老板的信任?

之前都是基础研发,现在一下子就来了两个大活,通过活人的行为对计算机数据进行引导。

安夏把他叫到办公室:“根据你的判断,大概要喂多久的资源,识别字体才能略有成就?”

“大概要……”他犹豫了一下,大胆的报了一个数:“如果按照现在计算机的使用人数增长率来看,可能需要十年。”

十年,人生有多少个十年。

他心里忐忑不安。

“嗯……”安夏点点头,计算机硬件价格现在还居高不下,大城市的人均拥有量都不高,远还没有到大幅增加的时候。

从现在就开始囤数据,不至于等十年,以后人工智障应该学会自己把划痕去掉了吧?大概。

数据收集急不得。

安夏收到一封来自美国的陌生邮件,自称他们看到了《村庄守卫者》和《王国破坏者》,认为这两款游戏非常有意思,非常有市场竞争力,他们希望可以参与投资。

“又是一家投资公司吗?”

安夏找人打听了一下,发现确实有这么一个公司,没什么名气,好像是某大学名下研究计算机的部门。

安夏拒绝了他们。

理由很简单:从各种方面来看,他们很穷。

她需要有一个稳定的投资人,不是投一轮,就把自己给投倒闭了。

这样会影响紫金后面的生产计划。