构化表示,其中一维是八层结构,二维是三层结构,三维是四层结构。而语义结构学的创始人之一波蒂埃则用了更简单的四层结构表示语义,分别是指标层、概念层、天然语言结构层、被产生的本文层。
词只是意义的节点,人们思维并不是在背单词,而是在构建词的互联网。这就是意义互联网。人们通过对话进行意义的互联,并在互联中形成意义本身。巴尔特的叙事结构分析,从结构主义角度特别强调将意义理解为一个网络。提出协调一致原则,“即使诸单元和诸功能之间的相互关系结成一整体组织或一相关关系网。此关系又分为本文内与本文外的两类”。这有点像意义的局域网和广域网之分。
人工智能要做的是将自然语言形式的意义互联网变为结构化的数据,分不同层次处理。用机器加快非个性化的、同类项层次上的数据处理速度,从而把资源有效地用于更富增值潜力的个性化响应上。这好比条形码把一些商品共同具有的信息标准化用机器简单处理,就可以使商家将服务资源用到更能创造价值的地方去。
我们这里不是搞专业语言分析,针对个性化经济所需来了解符号学,只要牢牢把握一条线索就不会迷航:我们要做的是如何把一个语言表达,从其指代的一般意义,在多种含义选择中,根据具体语境转化成唯一的、具体的一个意思,变多义为一义。这样,个性化经济,或者说后现代经济,就可以找到技术和商业上的真正立足点了。
语义分析:词的符号学
把商业引擎用在个性化需求的发掘上,我们应当怎么做?搜索引擎如果只是望文生义,或用简单概率方法搞词海战术,那只能是信息时代的小生产,并非真正的个性化。符号学的方法是将词语结构化,分出意义的快慢车道,根据商业价值高低分别处理。
词语一般都可以分为许多种类,看看词典就知道,但这并不是符号学上的分类。符号学对词语进行分类和结构化,主要是服从服务于从“能指”(形式)到“所指”(意义)的转变。它的问题导向表现在,帮助人们有效发现“一时有效”的意义,在“活”的话语中把握人们“隐喻”背后的真实想法。
汉语语义分析一般把汉语的一个词分为“用、代、属、分、族、参”六种属性,这有点像XML语言把商业对话的要素提炼出来一样。举例来说,电子政务、电子政府与政府信息化,词语不同,但类属却是相同的。类属,就是词的一个属性。搜索引擎如果不能从类属上对它们进行适当概括,就会搜索遗漏;而搞好了,看似不相关的东西就内在联系起来了。好比钓鱼,把不同的鱼放在不同的池子里,就要有针对性地用鱼饵。商家也是这样,在数据分析时,如果类都不能自动分清楚,个性化就无从谈起。
在语义分析中,关键的问题是对“引申意指”的把握,即对词语表面直指的意思之外的各种真实意思的把握。里奇在《语义学》中,将语言的意义现象分为7种。除第一种本义和最后一种主题的意义外,都被归为“联想的意义”,包括引申的意义、风格的意义、情绪的意义、反射的意义、搭配的意义。他对引申意指的定义是:“一词语借助超过其纯概念内容所指称者而具有的通讯值。”研究引申意指,最关键的是理解“隐喻”这个概念。奎罗将引申意指分为象征、隐喻和联觉,而利科认为隐喻就是引申意指:隐喻的归属作用本质上即建立相互作用网,它使得某语境成为真正独一性的。
后现代经济分析和语言分析都倾向于语境方法,将语词放在语境中确定其含义。也就是说,根据一个词所处的上下文来确认它多种含义中最切近具体情况的一个。
话语分析与叙事分析:句的符号学与文的符号学
句是词的上下文,文又是句的上下文。符号学越往后发展,越发现不能就事论事,就节点谈节点式地分析意义网络,话语分析与叙事分析在语义分析的基础上逐步发展起来。
从词的分析发展到句的分析,符号学经过一次质的飞跃。这有点像我国的输入法,从最早的拼音重码向以句为单位的智能拼音过渡的情况。而法国后结构主义则进一步认为,意义只发生于本文领域,德里达强调本文才是意义产生的“场所”。
艾柯采取普遍代码原则,主张“开放的本文”,认为本文的信息即为一个由不同层次信息组成的网络,各依存于不同的代码,在不同意指层次上起作用。他建立起一个详细的有10个层次的本文层次模型,艾柯对于本文解读过程的理解已经非常接近实际了,其中已经包含了伽达默尔关于对话中“意义的循环”的思想(我认为这是搜索引擎的最高境界)。可惜没人把它用在计算机网络上,没有用在智能搜索引擎上,把做许多国家首富的机会白白闲置在那里。