关键技术

智能数据挖掘技术

      我们采用成熟先进的数学模型,攻克了复杂样本的自动选取和匹配、建模变量分段自动化、未决平滑样条、多维优化分析等关键技术,真正使复杂的建模过程变得快速和精准。

  • 建模变量分段(binning process)的完全自动化

      在建模变量分段这个需要耗费专业建模人员大量时间的问题上,iBA通过自己的一套独特的算法,提供了专业的解决方案,不但使需要大量建模经验, 不断靠人工测试和调整的建模变量分段(binning process)成为自动化, 而且iBA的建模变量分段在实践中取得了非常好的效果。

  • 解决模型过拟合(overfitting)难题

      独创的未决平滑样条技术,非常成功地解决了预测模型中经常出现的过拟合(overfitting)难题,大大提高了预测模型的精确性和稳定性。

  • 灵活建模的精细化调整

      从专业建模师的视角看,iBA在变量筛选,快速生成预测模型,和对模型进行精细化调整方面,有着市场上同类软件所不具备的灵活性和专业性。

自然语言处理技术

  • 语义分析技术

      目前在文本分析领域自动分词技术的应用比较成熟,但是,基于规则与统计的分词技术,无法准确把握句子、段落的意思,这使得很难进一步深入分析。我们在分词技术的基础上,研发了可扩展的语义分析技术,全面把握词、句、段落之间的关联及意思,为更准确、更深入的分析提供了坚实的基础。

  • 智能学习技术

      面对网络的飞速发展,随着而来的就是词汇发展的新时代。我们通过技术研发,应用计算机的学习能力,使得系统分析紧随网络发展。

  • 自动分类技术

      不需要人工干预的自动分类技术,有效提高非结构化信息的加工效率。文本分类是指计算机根据文本内容进行类别划分的功能。

  • 自动聚类技术

      自动聚类技术是基于相似性算法的自动聚类技术,自动对海量的无类别文档进行归类,把内容相近的文档归为一类,并自动为其生成主题词,为确定类目名称提供方便。可应用于自动生成舆情专题,重大新闻事件追踪等等。

信息采集技术

  • 元数据搜索功能

      元搜索引擎集成了不同性能和不同风格的搜索引擎(百度、谷歌等)。查一个元搜索引擎就相当于查多个独立搜索引擎。进行网络信息检索与收集时,元搜索可指定搜索条件,从而既提高信息采集的针对性又扩大了采集范围的广度,收到事半功倍的效果。

  • 多方位定向采集

      可监控各大搜索引擎、新闻门户、BBS、博客、留言版,并针对客户需求,定向采集特定的网站的具体模块。

  • 信息智能提取技术

      网页内容智能提取技术能有效地提取网页中的有效信息,区分网页中的标题、正文等信息项,并对内容具有连续性的多个网页内容进行自动合并、网络论坛信息自动提取等。

  • 全天候不间断监控

      应用拟人化的采集更新,可定时监控,也可7*24全天候监控。