其他核心技术

 

全文检索技术

全文检索技术是数字内容运营的核心技术之一,全文检索通过事先建立的倒排索引,能够快速的从海量数据中检索出需要的数据。方正阿帕比的智搜全文检索技术支持布尔检索、短语检索、临近检索、模糊检索、通配符检索、范围检索、前缀检索、距离检索、权重检索,支持简繁体、拼音扩展检索,支持同义、近义等相关词扩展检索,支持过滤器和权限控制,支持结果的排序和分组,支持结果多类别分布统计,支持分布式索引和集群技术,通过段式索引和动态索引技术支持索引的高效更新,可通过数据网关支持关系数据库的索引更新,具有语法能力强大、安全性高、可扩展性强等特点。

 

版面分析和版面理解技术

版面分析和版面理解技术是利用版式数据中存在的版式信息,如:位置、字体、字号、颜色、辅助信息、版式风格等信息,佐以语义分析方法,从而提取版式数据的逻辑结构,将无序、无分类的数据,组织成有序,有结构的数据。阿帕比的版面分析和理解技术可以从复杂版面(报刊的版面)中提取必要的文字和排版信息,自动判定排版方向、合并正文块,自动还原正文阅读顺序,自动关联文章标题和正文,并进行附图与图说、文章与附图之间的自动关联,具有智能程度高,准确率高的特点。阿帕比的版面分析和理解技术还可以处理图书版面,自动进行版心定位、页眉页脚和页码处理,自动进行目录提取、章节切分,进行参考文献等辅助信息的条目化处理,具有效率高、准确率高的特点。

 

分布式数字内容传输与控制技术

该技术负责控制各个数据源之间的高效的海量数据传输。通过管理各个数据源终端,控制其使用带宽、任务,配合数据传输的范围和打包方式等策略,保证数据上传和下行的可靠、高效和安全。该技术是方正阿帕比提供电子书、数字报刊等数字内容服务的重要保障,也是各出版单位进行数字出版的重要保障。

 

跨平台阅读技术

现在,各种各样的便携移动设备的硬件性能不断提高,基于移动设备阅读高质量的电子图书已成为可能,移动设备的便携性必将促进数字出版产业的发展。移动阅读设备包括电子书专用阅读器、PDA、智能手机等等。方正阿帕比已经攻克跨平台阅读技术的重大难题,不仅可以在PC上阅读,也可以在专用阅读设备上阅读;不仅能符合中文的版面规范、并且电子图书格式与PC机一致,可避免重复制作。

 

统一的数字资源服务和检索技术

方正阿帕比具有统一的数字资源服务和检索技术。用户可根据自己的需求,对Apabi数字资源平台的首页是否显示进行配置,也可以对首页显示模块进行配置,还可以对资源的各种权限进行控制;资源平台提供多种资源的统一检索功能,能同时实现对电子书、数字报、年鉴、工具书、精品图片等多种资源的检索,并能实现多种资源之间的相互关联。

 

连续性出版物内容管理技术和发布技术

聚焦于传统版式文档的内容面向新媒体进行转型拓展的流程,特别关注于连续性出版物的特点,在新媒体生产流程改造、原始版式文档内容利用、多形态新媒体内容产品发布、数字内容产品策划重组和挖掘、数字内容控制与发行、新形态广告的管理和投放、基于内容的用户互动等方面有着多年的积累,相关技术较为成熟,在多个领域都有广泛应用。