电话:400-123-4567
Email: admin@baidu.com
传真:+86-123-4567
手机:13888888888
伴随着移动互联网及物联网的蓬勃发展,大数据及其应用应运而生,也随之衍生了各种新技术、新概念,比如目前非常流行的数据湖、数据中台、数据治理等,在企业运营环境之下,它们之间有什么区别和关联呢?
首先应该明确,新技术和新概念并非仙丹妙药、包治百病,只有深入分析企业业务模式和实际现状,充分理解和认清企业数字化转型的意义及目标,才能找到适合企业自身数字化转型的方式、方法。
大数据是将来自前端的海量数据,以结构化或非结构化形式快速导入到一个集中的大型分布式数据库或分布式存储集群中,利用分布式技术来对存储于其内的集中海量数据进行查询和分类汇总等,以支持后续数据分析需求。
适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统等。
按照大数据(Big data)研究机构Gartner给出的定义,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,因此,大数据为企业数字化转型提供了基础和源动力。
大数据时代,数据量越来越多,数据形式日益复杂,而以数据仓库为代表的、现有的数据存储和处理技术都无法满足海量、多样的数据处理需求,由此产生出了“数据湖”。
数据湖就是原始数据保存区. 虽然这个概念国内谈的较少,但绝大部分互联网公司都已经有了。国内一般把整个HDFS叫做数据仓库,即存放所有数据的地方,而国外一般叫数据湖(data lake),最早是由Pentaho首席技术官James Dixon于2010年提出。
“数据湖”技术不仅可支持企业各种各样的结构化、半结构化与非结构化和二进制数据的集中存储及处理,还可以结合先进的数据科学、机器学习及AI技术进行大数据分析,帮助企业构建更多优化后的运营模型,也能为企业提供预测分析、推荐模型等其它能力,以助力企业能力的持续增长。
数据湖具有卓越的数据存储能力,支持海量、多种类型的大数据统一存储。但随着企业业务模式的发展与演变,沉积到数据湖中的数据定义、数据格式等都在发生着实时的改变,如果不加以治理,企业的“数据湖”就有可能变成“垃圾”堆积的“数据沼泽”,而无法支撑企业的数据分析和使用。
只有让“数据湖”中的“水”流动起来,并在流动过程中进行疏导和净化,才能让“数据湖”的“水”保持清澈、流畅,所谓“数据治理”,也就是在迁移数据源时进行一定的数据转换,形成清晰的数据目录,对数据湖中的数据分区域、分阶段地进行清洗和处理的过程。
数据治理计划的结构有助于利益相关方了解组织数据,确保数据安全,并获得对数据的信任,尤其是随着企业扩大规模并积累更多的数据源和资产。
数据中台是一套可持续“让企业的数据用起来”的机制,是针对企业数据的一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。
因此,数据中台和数据治理工作是一个体系性的工作。虽然涉及的绝大部分领域相同,但数据中台并不仅仅是数据治理工作的放大升级版,而是数据治理工作的深化,它强化了数据治理的深度和广度,并拓展了数据治理不涉及的数据应用领域。借助数据中台,企业才真正实现了内部数据的闭环。
因为在当今互联网时代,用户才是商业战场的中心,为了快速响应用户的需求,借助平台化的力量可以事半功倍。不断快速响应、探索、挖掘、引领用户的需求,才是企业得以生存和持续发展的关键因素。
通过云计算,物联网,人工智能,云平台,移动化,网络安全等IT及互联网技术结合汽车行业营销端的业务构成(基础+中台+前端触点)来实现数据价值的量化,帮助汽车企业为自身客户持续创造价值。返回搜狐,查看更多