版面理解和智能标引技术解读

技术摘要
版式文件的版面理解和智能标引技术:利用了知识工程方法,总结了版式文件中的排版规则,同时参考文字语义信息和版式文件中预制的标引数据,对版面内的数据进行综合判定,可以高效、较为准确的自动提取出版式文件中的文章、标题、作者、内容、版次等结构化数据。
根据书报刊不同版式的特点,存在不同的处理逻辑和不同的技术手段。

以下内容需要付费方可阅读
¥50.00付费后查看