语义代码

一种后组式情报检索语言。它通过概念语义因子的组合表示文献主题的复杂概念;其词汇单元间的参照关系,不用词族表或词族图表示,而通过自身结构来表示。有两种语义代码佩里-肯特语义代码和RX语义代码。

佩里-肯特语义代码

是美国 J.W.佩里和A.肯特在1954~1959年为电子计算机情报检索研制的情报检索语言。这种语义代码的建立方法如下:

(1)确定基本概念语义因子。语义因子的逻辑组合,可以构成各种概念。如概念“感应电炉”可以用语义因子“设备”、“加热”和“电”的组合表示。

(2)确定概念的分析关系,用以表示概念和语义因子间的逻辑关系。如概念“感应电炉”与其语义因子间存在下列分析关系:“属-种”关系;“感应电炉-设备”;“对象-用途”关系:“感应电炉-加热”;“对象-手段”关系:“感应电炉-电”。

(3)给出概念的综合关系(语义代码的语法)。综合关系──词间的逻辑关系用职号表示,职号用K字母开始的3个字母表示,如KAM表示对材料施加的动作,KEJ表示被加工的材料,KQJ表示动作的手段,其含义是语义代码的词赋给的。

语义代码是一种严密的逻辑语言体系,每个词汇单元的语义结构都用明确的形式表示。语义代码的词称为叙词,由语义因子或其组合表示。语义因子由4个英文字母表示,第1和第3、4个字母用来表示概念的类称。为便于记忆,采用与英文词概念对应的辅音字母表示语义因子的含义。 例如,L-CT (Electricity) ──电;M-CH(Machine)──设备,机器,仪器;P-HT(Heating)──加热;M-TL(Metal)──金属;P-SS(Process)──过程,操作,动作。第二个字母表示中缀,用不同字母表示各种分析关系。例如A表示“种-属”关系;E表示“材料-事物”关系;U表示“事物-用途”关系;Q表示“工具-对象”关系;W表示“过程-对象”关系;Z表示“外部相似”关系等。把中缀字母填入语义因子中的空位,可以限定其含义。例如,MATL表示“一种金属”,METL表示“金属的”,PUHT表示“用于加热”,PQHT表示“用加热法”。语义因子的组合可以构成复杂概念。例如,“感应电炉”的含义为“用电加热的设备”,其语义代码为LQCT.MACH.PUHT.005。“005” 为数字后缀,表示“感应电炉”与其他电加热设备的区别。

RX代码语言

用带数字的拉丁字母X表示术语、R表示术语间关系的一种情报检索语言。它是苏联乌克兰科学院控制论研究所Э.Ф.斯科罗季科领导的小组在1960~1964年为电工和计算技术专业研制的情报检索语言。在这种语言中,每一对RmXin表示某一主题或概念的特征。这里,m表示接联词指数,n表示术语类别指数,而i表示术语派生程度指数。把词对连接成词串可以表示复杂的主题或概念。例如 ,复杂句“活塞运动引起曲轴转动”可用RX代码语言表示如下:

XaR050 Xb. XaR123 Xd. XaR321 Xc.XbR253 Xc.XbR120 Xd. XcR050 Xd,这里,Xa表示“活塞”,Xb表示“直线往复运动”,Xc表示“曲轴”,R050表示“客体”,R120表示“原因”,R123表示“工具”,R253表示“对象”,R321表示“作用于”。