诚信、创新、合作、共赢

Integrity, innovation, cooperation and win-win

肺癌标准化数据库

首次将肺癌诊疗及临床研究内容规范化

系统的建设规范了数据质量

基于报告的结构化标准建立了结构化报告规范,为临床科研及应用都提供提供决策支持。同时,基于大数据平台构建临床质控体系,对病种内病种间的研究提供科研依据。

油田大数据

结合吉林油田实际生产需要,系统搭建基于Hadoop平台的分布式计算框架、ETL管理工具环境及模型引擎环境。通过对油田数据的采集、清洗及数据标准化处理,建设油田大数据分析标准化数据库。利用ETL技术、大数据计算技术、数据分析与挖掘技术结合统计学和机器学习算法,构建免修期数据模型,对免修期影响因素及免修期数据范围进行分析,预测油井免修期。系统实现了作业影响因素分析、故障发生时间预测、免修期计算及预警等,并开发数据可视化展示及维修作业数据管理平台。

智慧交通大数据建设

处理流程

1 高速数据采集

高速收费系统、客服系统、发行系统等多平台的数据

2 高速数据处理

基于大数据平台进行结构化、非结构化数据抽取、转换、清洗,同时基于分布式大数据平台搭建数据仓库,实现图片、视频、文本分布式存储及海量结构化数据存储。

3 车流量预测模型

利用NLP、机器学习与大数据等技术建立车流量预测模型,进行收费站车流量数据及缴费数据的挖掘分析与数据展示。

项目成果

1. 寻找数据规律、分析推理、预测未来趋势,可灵活调度资源,降本增效。

2. 非结构化准实时数据动态抽取,实时分析,构建专题数据库,为业务系统提供支撑和管理决策。