语义智能搜索奠基下一代互联网
开篇语
在国务院下发的《关于加快培育和发展战略性新兴产业的决定》里,七大战略性新兴产业并不包括文化创意产业。
但这并不表明否认文化创意产业的战略性。实际上,该文件不多见地将“文化创意产业”直接写入了“新一代信息技术产业”里,要求“大力发展数字虚拟等技术,促进文化创意产业发展”。
而在广东,文化创意产业已被明确纳入战略性新兴产业范畴。在《广东省建设文化强省规划纲要(2011-2020)》中,省委省政府提出,要“着力培育文化领域的战略性新兴产业”,“让文化产业成为我省的重要支柱产业和战略性新兴产业,广东成为全国乃至亚太地区具有核心竞争力的文化产业中心”。
文化创意产业已经成为21世纪的朝阳产业,富有的发达国家越来越意识到创意对增长的贡献。而在广东,文化产业已经成为新的经济增长点和支柱产业之一,并在全省经济转型和产业结构优化升级中充分发挥了战略带动和牵引的作用。2009年,广东文化产业逆势飘红,实现增加值2149亿元,连续第七年名列全国榜首。
随着《纲要》的出台,广东文化创意产业迎来前所未有的发展机遇。
今天起,本报推出“战略性新兴产业南方大调研”之文化创意产业。首篇“创意先锋”中,我们在动漫、特殊影视技术、互联网等众多广东领先的行业里,选择呈现一个尚不为太多人知道的“星星”:引领下一代互联网核心技术的语义智能搜索技术。
比起那些已经成熟的“庞然大物”,这一技术虽然还待字闺中,却在未来有着无限宽广的可能性。面对这一全世界梦想破解的难题、全中国努力攀登的高峰,广东占据了世界领先的战略制高点。
“世界上最远的距离,就是我们俩一起出门,你去买苹果4代,我去买4袋苹果。”自从Iphone4面市以来,这句话就开始在网络流行。
事实上,比这还远的距离可能是:为了买苹果4代,你输入“苹果”搜索,百度却可能给你“范冰冰佟大为《苹果》完整版浴室戏”。
目前的网络搜索,即使强大如Google,也仅仅能够反馈给用户夹杂着各种噪音和无用信息的“大包裹”。有没有一种技术,能够精确地分析、挑选出你想要的信息?
答案是肯定的。广东汕头大学出版社社长胡开祥告诉记者,他们开发的以语义搜索为核心的“TAI信息内容综合处理技术”(以下简称TAI语义智能搜索),可以让你的电脑像你一样会思考。“你要一滴水,就给你一滴水,而不是一条河,更不是一片海。”
胡开祥说,语义智能搜索技术更准确的说法应该是“语义智能信息处理技术”,不仅仅基于关键词检索,而是能够理解WEB页面的内容,并进行逻辑推理来完成复杂的查询任务,最终返回精确的结果。
语义智能搜索属于下一代互联网的核心和基础性技术,相关研究在国外很多。其实际应用,最广为人知的,可能是微软新推出的搜索引擎“Bing”(中文翻译为“必应”)。但胡开祥说,Bing呈现出来的技术,只达到他们已掌握的技术的7%。
体验智能
你的电脑懂得你需要啥
未来某一天,你想带女朋友去看红叶,于是你打开搜索引擎,输入“红叶”二字。你想得到的也许是香山红叶,也许是井冈山红叶,也许是香榭丽舍大街的红叶。没关系,你不用一条一条翻阅,电脑会自动为你分门别类,让你精确地找到想要的信息。
你想重温《红楼梦》,可只想看与“宝黛爱情”有关的部分,于是你打开资料库,输入“宝黛爱情”,于是《红楼梦》里只要是宝黛爱情的部分,都给你提取出来。
你看一篇论文,想迅速了解它的主题思想。没问题,电脑会帮你准确地总结。
甚至,你想看电影《哈利·波特》,但只想看有关骑着扫帚飞行的部分,计算机就给你所有有关飞行的镜头;你想听一首歌,但只想听副歌部分,那么机器就给你唱副歌。
在语义智能搜索技术支持下,这些都不是幻想。甚至,这些已经不是未来了。记者走进汕头大学出版社,体验他们的TAI语义智能搜索时,发现这已经是近在眼前的现实。
“现在的人不缺信息,信息已经太多、太滥,我们缺的是精准的信息。于是需要一个技术,能够在最短的时间内找到最正确的信息。”广东省新闻出版局科技与数字出版处处长苏毅说,这就是语义智能搜索技术诞生的市场和需求基础。
但目前在全球范围内,语义智能搜索技术并没有类似Google这样得到公认的权威代表。今年5月发布的《国家发改委办公厅关于当前推进高技术服务业发展有关工作的通知》中,提出加强语义智能搜索引擎研发及应用的要求和目标。
语义智能搜索总体还处于摸索阶段。
世界难题
语义搜索时代若隐若现
语意搜索不仅是中国的,也是世界性的课题。当关键词搜索带给大家越来越多信息的尴尬时,人们就开始期待下一个搜索技术,它具备人脑的逻辑与分析能力,能够理解人类语言的表达方式,搜索结果与用户需求实现更精准的匹配。
为了这个目标,人们研究了几十年的“人工智能”、“人类语言处理技术”,希望让这张网变得更智能,能“看明白”人类的自然语言。但到目前,世界范围内语义智能搜索的时代还只是若隐若现。除了Bing,至少出现了7个类似的比较优秀的语义搜索引擎,包括Kngine、Hakia、Kosmix、 DuckDuckGo、Evri、Powerset、Truevert。体验后的读者可能会发现,这些距离人们想象中的智能信息处理依然遥远。
在国内,语义智能技术也有所成就。“华农在线”网站依托自主产权的智能语义理解技术(HNC),在一定程度上做到了基于语义的智能化垂直搜索。比如用户输入“西红柿”,检索结果不仅有“西红柿”的相关信息,还能检索出关于“番茄”的信息。计算机通过知识库,能够知道西红柿与番茄是同一事物。不过,HNC 目前收词范围仅限于农业行业,不涉及与农业无关的词语。
苏毅透露,这方面,广东走在全国的前面,可以说占领了战略的制高点,“国家提出一个目标,我们广东已经有成果,只需要转化了。而且,广东的技术是全世界NO.1。”
苏毅所说的成果,即是汕头大学出版社自主研发的TAI语义智能搜索技术。胡开祥告诉记者,从已知的研究成果来看,TAI语义智能搜索在全国是最成熟的,在全世界也是一流的,“Bing的技术只相当于我们已掌握技术的7%”。
“Bing用到了语义搜索技术,但它是在一句话的邻近两个词的关系做语义的分析,处在语义搜索的初级阶段。所以,虽然Bing研发出来,但大家还是用 Google。”胡开祥说。而TAI语义智能搜索技术中,现代汉语2亿多字词都被按照知识本体和计算机编码的方式一一定义,已经可以准确地分析和搜索处理。这些词条还在依据现实发展不断更新。
“如果说Google是把原油从地底抽出来,我们的技术提供的就是分解好的汽油或柴油。”胡开祥说。
初尝果实
未来图书不再是一本书
从上世纪80年代开始,胡开祥和一群志在研究计算机智能化的研究生聚集到一起,开始了语义智能搜索技术的研发。研究团队由不同学科领域、不同院校的研究部门的上百人组成,其中有学计算机的,有学哲学的,还有语言学专家。
研发过程之初,政府没有扶持,依靠部分企业和团队成员支撑。面临着未必能成功的巨大压力,很多人中途退出。
资金缺乏的时候,自己掏腰包去维持。研究团队成员只能凭着只做研究、不求回报的精神支持下去。
胡开祥感慨说:“将近20年,我们处在埋头研究但又没有成果的焦虑状态,可能一辈子默默无闻地就过去了。这是科学研究一个很严酷的现实。”
- 低压电子变压器市场需求渐增音频插头流程泵触控产品童装集成吊顶Frc
- 10月30日江苏地区天然橡胶行情动态荆门一字夹木工锯片泵壳牛仔帽Frc
- 原油强势无助沪胶上行投资者继续保持观望碳化钨臂章胎教配线架本田配件Frc
- 化纤以高科技形象走上前台软件德兴电镀铬接线盒电子印刷Frc
- 漂亮套标激发你的购买欲望纯净水机普洱动力柜裸石扭力Frc
- 看奥运聊知识管理之七到九台山电声测试挤奶机烧结炉老花镜Frc
- 小米试水机顶盒加速进入智能电视领域0西昌牧草机械花边剪磨粉写字楼Frc
- 玉柴YC6K系列发动机首次亮相大型展会0快干水编织机砖机周边旅游调压阀Frc
- 对马达控制的误解及其实际情况光学配件污水处理车载音响地毯数传模块Frc
- 西门子结合世博会活动举行工业论坛桐城压桩机彩喷纸特殊香料转椅Frc