当前位置:在线查询网 > 在线百科全书查询 > 全文检索产品

全文检索产品_在线百科全书查询


请输入要查询的词条内容:

全文检索产品




1. “企业级安全”的搜索引擎


严格的信息安全分级体系,保证信息可管理性

企业搜索在安全方面的要求远远高于互联网搜索。企业内部的各种信息内容带有明显的安全级别属性和部门归属属性。几乎每个企业都严格规定了什么样的信息可以给什么样的人阅读,某种信息归属哪个部门发布与存储。

起点企业搜索平台针对企业内部信息系统中,不同的用户使用权限不同的这一特点,提供针对用户、对资源进行权限分级管理和控制能力,确保企业内部信息系统的安全。各种资源在接入系统时会要求设置安全级别,便于对用户访问行为进行控制。

可靠的安全保障手段,实现系统的授权访问管理

起点企业搜索平台广泛采用了用户帐号权限控制、IP地址授权和过滤技术,保证对系统的接入安全。通过信息智能分析和过滤机制,设置敏感词表和禁查词表,对检索结果中的敏感信息提供安全管理。实现完善的日志记录机制,保证信息的访问和阅读有据可查,便于及时处理各种信息内容安全隐患。

良好的安全扩展体系,可方便的与内部系统对接

起点企业搜索平台在数据采集和获取过程中,通过安全的扩展体系,支持以授权方式访问内部信息系统、内部文档目录,保证安全的基础上,实现信息的共享服务。支持对内部某些信息系统的权限统一管理,实现系统间的权限映射。

2. 多操作系统、多平台、多数据库支持


本产品支持的操作系统、应用服务器、数据库如下:

操作系统 Windows
Linux
Unix

应用服务器 Tomcat
Weblogic
Websphere
Resin
Apache
IIS

数据库 Mysql
Sql Server
Oracle
DB2
其它……

其它必备环境 JDK1.5 以上版本

3. 支持多数据源采集


通过指定文件服务器、数据文档目录等方式,灵活管理数据来源,根据不同目录或来源划分为后续安全管理提供自动级别信息。根据内容来源,判断是否需要进行文档格式化分析,将数据库直接读取的结构化信息和半结构化网页信息通过分析模块和元数据描述进行统一。

除了基于非结构化数据进行采集外,还可对PDF、WORD、HTML、TXT、各种图片等四十多种文件格式自动采集。同时根据用户需要本系统也支持采集其它各类数据源,例如:XML文件、其它数据池等。

4. 智能化的检索服务


起点产品在全文检索过程中采用相关智能技术以达到迅速、准确、全面定位目标信息。例如采用相关度分析技术,使相关度较高的结果排在结果列表的前面,相关度较低的结果排在后面,并屏蔽无用和错误的信息;构造强大的语义规则库,使系统能够正确地判断与检索词相关的同义词、近似词、上位词、下位词,帮助用户判断结果的相关度,并进行进一步的查询;支持完善的信息分类体系,对检索结果自动分类或者信息聚类;提供智能化的概念扩展查询等。通过这些技术,能够满足大多数智能化搜索需求。

5. 强大的信息海量数据实时索引和管理功能


起点产品不仅提供了快速检索功能(在千万级数据下,全文检索能在1秒钟之内完成),同时也有着高效的海量数据处理能力。每小时能处理百万的数据库数据,或是几十万篇的文档。包括中文的分词和建立数据索引。我们的产品在多个大型项目中经过了实际的检验,成功实施过多个超过5千万数据规模的项目。

6. 中文语言处理技术


中文语言处理是搜索引擎必须具备的技术之一,应用中文语言处理技术才能使搜索结果更加符合用户习惯,更加接近用户的期望结果,起点产品集成了中文分词技术,并有着40万词库的支持,用户也可以根据自己的需要和行业特色来添加和维护词库。中文分词技术的准确率和召回率都达到96%以上。

7. 健壮可靠的系统,按需扩展


针对大型应用系统和海量数据的环境,提供多机分布式或双机互备的服务体系结构,通过把企业内部各种内容分布到不同服务器,可实现用户的应用层实现透明访问,支持松耦合自动切换的双机备份策略,提高系统的运行可靠性。分布式架构允许通过增加硬件的方式增加系统处理能力。8. 支持多种语言开发接口,与其他系统无缝集成 起点产品以标准的WebService和标准XML方式提供多种语言开发接口,支持的语言包括.NET,JAVA,PHP等。可与各类WEB应用进行无缝集成。同时提供完善的二次开发API手册帮助及应用示例。

9. 操作简易、维护方便


起点产品提供完整的后台界面,所有配置和操作都可以通过IE访问产品后台进行,操作简易,维护方便,同时也不影响服务器的安全性。