但事实哪有那么简单。
反正进行了一晚上尝试的尹芙·卡莉发现想要进行复现很难。
抛开l提出的算法技术本身不谈。
就是l在生成式摘要算法专利中顺手牵羊搞定的那个“l文本摘要准确度衡量模型”
其他团队想要从无到有的构建一个同样的模型都有亿点困难。
说起来l文本摘要准确度衡量模型的构建过程思路倒是很清晰:
第一,运用语言模型来评估算法生成语言的流畅度;
第二,使用相似度模型评估文本和摘要之间的语义相关性;
第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。
然鹅也仅仅是说起来很简单而已。
说到把大象放进冰箱也很简单同样是三步:
——打开冰箱门,放进大象,关上冰箱门。
知道怎么做没用,关键还是要执行。
没办法执行的话,步骤再清晰也没用。
l文本摘要准确度衡量模型的构建过程有三步。
第一步就很复杂。
该怎么进行语言模型的构建呢?
按照l提出的技术路线。
语言模型建模过程中,包括词典、语料、模型选择等。
问题出在语料库上,语料库一词在语言学上意指大量的文本。
这类文本通常经过整理,具有既定格式与标记。
涉及到英文语料库的信息还比较容易,毕竟尹芙所在的团队和牛津、哈佛、耶鲁三所大学的语言学方面都是深度合作的关系。
但涉及到以及其他文字预料信息该怎么处理这就完全不好说了。
巧妇难为无米之炊。
没有语料库清楚技术路线什么的也没用。
倒是可以姑且先抛弃对以及其他新闻生成式摘要的研究。
但是这样几乎等同于放弃了一个庞大的市场。
而且最关键的是l提出的算法本身就能兼顾新闻摘要以及英文新闻摘要。
那么之后l会不会直接开发个新闻处理成英文摘要的功能呢?
能搞定文本摘要处理算法的人没道理一个翻译算法都搞不定吧??
尹芙·卡莉越想越觉得这种可能性很大。
不然为什么一个摘要软件要做成类似于翻译软件那样的交互风格呢?
在她们还在踌躇不前的时候。
对手却早已经大步向前挺进了。
一时之间尹芙不禁有种酣战过后的无力感。
这就是所谓的一步落后步步落后吧。
这种情况还评估啥?
直接建议谷歌方面把l的算法买回来就好了!
虽然l是华国人
但这种技术又不是什么涉及到国家命脉的重要技术。
总不至于不卖吧!
不卖的话谋求专利授权也可以啊!
总不至于非跟在别人身后造轮子吧。
尹芙又没受/虐/欲。
……
事实上,不止海外在关注林灰折腾出的算法。
国内也注意到林灰搞出的动静。
只不过国内目前的目光主要集中在南风app的软件层面而不是算法层面。
国央大学副校长兼计算机学院的副/院/长贺天昌自南风app上架之初就对该软件保持着高度的关注。
虽然夜已经深了,他仍然在通过第三方数据网关注着南风app软件的下载情况。
贺天昌在外界并不怎么出名,但此人在软件行业却是大名鼎鼎。
其在业界颇有名声。倒不是因为其在软件开发上鼓捣出什么名堂来。
而是因为其资历老啊!各行各业都看资历,软件行业也不能免俗。
不过贺天昌的资历也经得起看,他和王民基本是同一时期鼓捣软件96年的人了。
就这份资历全国互联网/软件行业能和其比肩的大老也没几位。
有这种资历就算在软件行业没啥作为也无所谓。
真想拉投资的话以其资历在互联网圈子随随便便拉个几千万的投资也不过是打几个电话的事情。
就这么一个原本搞软件的人怎么跑到大学来了?
故事要从九几年开始说起,在感受到互联网浪潮之后。
刚从米国加州理工计算机博士毕业的贺天昌放弃了美国优握的工作。
回国参与创业,在王江民鼓捣出杀毒软件的时候,贺天昌也搞了几个软件。
不过和前者鼓捣的民杀毒软件不同。
贺天昌鼓捣的软件,一般都是小众但专业性很强的付费软件。
虽然这个软件以现在的眼光来看做的还算可圈可点。
但这样的软件在96年的中国注定是生不逢时。
不光96年这样的软件生不逢时,在这之后十多年时间也都是免费软件大行其道,付费应用一直是没啥市场。
p:……付费盗版除外,早期起家史
事实也验证了这点,混迹软件行业六七年,贺天昌除了收获了一些早期互联网红利之外别无所成。
更多的时候反而是在亲历别人的成功之外。
虽然他赚的钱和同一时期的人相比相形见绌,但其收入依旧足以羡煞普通人了。
但人的追求不同,贺天昌更想要的是自我实现。
然而一个人的命运光奋斗是不行的,不符合时代诉求再折腾也没用。
折腾了几款专业性极强的小众软件没收到回报之后,心灰意冷的贺天昌干脆也不瞎折腾了,刚好有朋友引荐他进入国央大学。
贺天昌综合思量之后,觉得国央大学还行。
直接经朋友引荐进入了国央大学任教职。
树挪死人挪活,这之后贺天昌反而是混得顺风顺水,一路辗转爬到很多人难以企及的高度。
虽然身居常人难以企及的高度。
但贺天昌因为早年的经历,其目光也时刻关注着国内专业软件的市场。
然而一直一来,贺天昌很失望,打着专业名头的软件不少。
真正专业的软件却一款都没有。
一个国家的软件业最先进的工业软件鼓捣不出来就算了,专业软件也弄不出来?
贺天昌对此一直耿耿于怀。
而南风app的问世却打破了他的心结。
综合了很多方面的因素衡量,这个软件确实具有专业软件该有的素质。
而这个软件的专业模式更是符合专业软件该有的全部特征。
看到国产软件市场有这样的软件问世,贺天昌可以说是大为欣慰。
不过他旋即又担心了起来,即便有优秀的专业软件没有市场不是一样难免夭折的命运吗?
看着南风app的第三方数据,虽然下载量不错。
但是专业模式的付费人数才两位数。
这怎么能行,做垃圾游戏的赚的盆满钵满,认认真真做专业软件的人却得不到回报?
这算什么道理???
不行!
!不能让这样优秀的软件开发者重蹈他昔年的悲剧。
贺天昌决定做点什么,默默拿起手机拨通了一个老友的电话。