目前数据仅是“数据”还不是资产
企业数据资产化这一概念已经在业内谈论了很久,如今的传统企业数据意识较之前也有了一定的增强,但是数据底子还是相对薄弱。派拉软件大数据架构师高超认为,从数据资源转化为数据资产,一个必要前提是数据能否带来附加价值,即数据能否创造新的业务。他认为企业数据资产构建将经历三个必然阶段:
第一阶段,企业数据资源的收集阶段,该阶段需要打破企业的传统管理理念,将企业的数据资源由分散式管理变更为集中式管理;第二阶段,企业数据资源的识别阶段,该阶段的一个主要任务就是数据治理,需要将企业的数据资源进行梳理、识别、精细化与标准化,以便更好的加以利用。第三阶段,企业数据服务能力的建设,该阶段的主要任务是将已有的数据资源以一种业务能力(数据目录、数据地图、数据网关等形式)提供给企业的人员,让数据能够快速推进业务发展,创造新的业务价值。
第三阶段的企业数据服务能力建设是企业数据资产化的关键期,而当完成了以上阶段,一个企业的数据资产价值转化才谈得上已经实现。“目前对于大多数企业而言,数据仅仅是‘数据’,还未形成资产。”高超强调。
不同行业由于其业务模式不同,数据积累存在差异,因此实现数据资源整合,释放数据价值也会有不同的实践路线。高超认为对于当下而言,企业首先应该建立自己的数据资产,为后续的价值变现提供可能性,接下来必须进行有效的业务创新,让数据创造新业务,提升企业竞争力,才能更好的达成这一目标。
以派拉软件的重点客户制造业和金融业为例,制造业的数据涉及业务的全生命周期,相较于金融业其数据量更大,业务链路更多,场景也更为复杂,麦肯锡全球研究所(McKinsey Global Institute)的数据显示,制造业是目前数据最多的行业,平均每年产生1.9 PB的数据。其中,在供应链、采购、工厂运营以及合规和质量管理阶段会生成大部分数据。不过制造业对新技术的接受和应用一般晚于金融业,其数字化建设还停留在数据资产建设的第一阶段,刚开始构建大数据平台。而金融业得益于其先天信息化积累的优势,加上前几年互联网技术的应用,很多企业机构已经在做数据资产第二、第三阶段的尝试和建设。
从数据资源转化为数据资产,绕不开技术的应用。面对琳琅满目的新技术,企业该如何选择是在做相关项目时经常讨论的议题。2019年独立研究机构 Vanson Bourne 对来自 15 个国家和地区的 1500 名 IT 决策者和数据经理进行了一项调查,发现企业整合数据管理的能力还有待加强,只有 29% 的受访者称,其企业已部署全面一体化的战略性数据管理方案。这说明,大多数企业还在采用孤立的方式,难以集成分散的数据管理解决方案。
高超认为还是要遵循因地制宜、循序渐进的原则。企业不应盲目引入新技术,一切都是以推进业务发展为准绳。结合自身情况做充分评估后再制定转型变革解决方案,然后按计划执行逐步执行。
引入新技术是基于长期价值的综合考量
解决业务烟囱、数据孤岛的问题,企业对于云计算与大数据技术不会陌生。高超认为云和大数据是两种相辅相成的技术,云平台的使用可以降低企业数字化业务的使用门槛,可以更快速方便得交付业务成果,同时大数据平台可以基于云环境构建,不少企业都是云平台和大数据平台一起构建,有的企业也会构建自己的业务中台和数据中台。
为了保护企业内部数据安全和充分利用数据价值,2019年5月份,一汽集团制定了业务中台和数据中台的双中台战略。作为一汽集团双中台战略的合作伙伴之一,派拉软件携手一汽集团搭建数据中台,推动数字化转型,云与数据技术同步进行,其中涉及到私有云向公有云动态扩容的跨云融合,最终实现了数据赋能,获取海量IoT数据流控制力,实现业务的全新观察视角,为触达终端用户提供手段。
“对于业务交付效率要求比较高,IT人员配置比较少的业务,上云是一个很好的选择。”不过也需要明确云在现阶段亦有其弊端和局限,引入新技术是基于长期价值的综合考量。
比如成本是上云要考虑问题,高超指出以公有云为例,云平台的资源复用成本与长期使用的未来成本非常高,若自建平台,两套业务过程可以共享同一套硬件环境完成,但是在云平台中就需要付出两份成本以完成两套业务过程。前段时间NASA由于付不起高昂的下载费用,无法下载其在AWS上的数据就是实例。关于上云的告诫早有先声,在2016年Veritas发布的“数据冰山”报告中曾经指出,数据迁移至云后,受控于云供应商是企业所面临的真正问题,在12 个月内,无论企业出现任何问题,例如成本上涨,50% 以上的企业都无法立即更换云供应商。即便如今多云管理等相关技术日趋成熟,成本和被供应商绑定依然是上云要考虑的重要因素之一。此外,企业也会考虑安全性与合规性而选择私有部署,不会上公有云。
另一个重点是数据湖,数据湖是当下比较热议的技术,业内普遍认为数据湖是大数据平台发展的下一阶段。简单来讲,数据湖是来自各种来源的原始数据的存储库,可以按原样存储这些数据,然后根据需要对其进行过滤和分析准备,其特色是可以存储处理非结构化数据,但是不会替代数据仓库,两者相互协同。
高超指出目前国内构建数据湖平台的企业还不多。而且,数据湖必须站在整个企业的视角去规划和建设,这一过程仍会遇到不少问题,同时其经济性效益也不会立刻凸显。但是数据湖是企业数字化进程中非常重要的一环,“数据湖就像汽车中的底盘,虽然表面看不到,却至关重要。”高超强调。
为了应对海量多源、异构数据所带来的挑战,数据湖是未来发展的大趋势,数据显示,全球数据湖市场在2019年的规模为37.4亿美元,预计到2025年将达到176亿美元,预计2020 – 2025年期间的复合年增长率为29.9%。
然而新技术的市场化探索不会一蹴而就,是否马上进行建设还要视情况而定。有传统企业IT相关负责人指出数据湖应用需要有大量的数据,其自身企业数据体量还不够,且几乎没有非结构化数据,目前并没有计划上数据湖项目,未来可能会引入。
技术是否合适需要在实践中检验,在推动企业数字化变革的过程中企业领导应该如何去做也是企业需要考虑的问题。
谁该来为企业数据资产化负责?
在从数据资源到数据资产转化的过程中,背后是数字化转型的大背景。涉及到数据这一重要要素,更多的是一把手责任制。派拉软件所观察到的也是如此,高超介绍自派拉软件开展大数据业务以来,已经与政府公安、制造业、金融业、零售业等行业的客户沟通交流,大多数客户都很好的贯彻了数字化转型是一把手工程的理念。数据资产化涉及企业全员,同样也是一把手工程。
从派拉软件实施的实际项目来看,大多数企业仍然是以CTO(首席技术官)或者CIO(首席信息官)牵头,但CTO/CIO更多的还是站在传统的业务视角来看待数字化转型,因此后续的执行过程中,特别是大型企业,或多或少的会产生一些业务冲突或者价值偏离的情况。少数新兴技术行业或者互联网企业,出现了CDO的角色,相较CTO/CIO而言,CDO(首席数字官)更懂数字化建设,更懂企业的数据价值,能够很好的推进企业的数字化转型。
具体来看CTO/CIO牵头所带来的部分问题,高超介绍一方面是业务视角带来价值偏离的问题,CTO/CIO的视角更多的关注企业通用型技术,各业务之间的运作平衡,而CDO更关注怎么让企业的数据赋能,产生新的价值,目标驱动不同,这样带来的业务视角会有差异。比如搭建一个大数据平台,CTO/CIO会关注用什么技术搭起来最高效便捷,CDO会关注数据情况,业务需求,然后决定用什么搭建的路线和方式。
另一方面是执行理念带来业务冲突的问题,CTO/CIO经常会让传统IT部门牵头来做大数据平台项目,而不是专门的数据部门或者数字化部门,传统IT部门在执行过程中会借鉴之前的项目经验。同样以搭建大数据平台为例,在大数据平台的建设中,业务链路从传统的业务源系统->业务应用,转变为业务源系统->大数据平台->业务应用或者大数据平台->业务应用,因此在具体的场景建设时,往往也会带来一些不同部门之间的沟通问题。“未来的企业数字化建设之路,必然是崎岖不平和充满挑战的,因此敏锐的洞察,精准的出击,有力的收放非常重要,我们建议更多的企业设立像CDO一样的角色,更好的完成这一战略。”
实际上在推动数字化战略过程中,除了CDO、CIO、CTO还需要CEO的支持,是否要建立CDO角色,如何进行数字化变革,身处不同行业不同阶段的企业会有不同的需求。在与部分传统企业IT负责人的交流过程中,笔者发现他们的数据意识已经发生改变,有的对IT如何赋能业务有比较深刻的理解,并进行了有效的探索和实践。因为涉及到变革会触及到利益,部门之间的沟通问题不可不免,他们会循序渐进,会逐步“利诱”业务和管理层支持IT变革,我们将在下一篇分享相关探索和实践,敬请期待。
毫无疑问,新冠病毒增加了世界各地报告的网络攻击和数据泄露的数量。根据联邦调查局的《2020年网络犯罪报告》在2020年收到了近80万份网络犯罪报告,索赔金额超过41亿美元。得益于
毫无疑问,新冠病毒增加了世界各地报告的网络攻击和数据泄露的数量。根据联邦调查局的《2020年网络犯罪报告》在2020年收到了近80万份网络犯罪报告,索赔金额超过41亿美元。得益于MI、人工智能和5G等现代技术,威胁在情报和速度上都有所增长,攻击和数据泄露的数量也有所增加。让我们来看看今年到目前为止世界上观察到的10个最严重的数据泄露事件。
1. Facebook, Instagram和LinkedIn
社交媒体上又一次数据泄露。 这一次,中国社交媒体管理公司Socialarks在一个未受保护的数据库中遭遇数据泄露,社交媒体上至少有2.14亿人的账户信息和个人信息被泄露。 泄露的400GB个人数据中包括许多名人和社交媒体名人。用户姓名、手机号码、电子邮件账户、个人资料链接、登录、个人资料图片、个人资料详细信息、关注者和互动物流、位置、消息ID、网站URL、工作规范、LinkedIn个人资料URL、链接的社交媒体账户用户账户名称和公司名称都是每个平台公开的数据。
2。 大众和奥迪
6月,一家第三方营销服务提供商公布了美国和加拿大330万大众和奥迪消费者的PII。姓名、邮政地址、电子邮件账户、手机号码,以及有关购买、租赁或查询的汽车的信息,包括汽车参考号码、制造商、类型、年份、颜色和装饰包装,都是暴露最多的数据。更多的个人信息,包括驾照号码和有限的出生日期,社会福利或社会保险信息,账户或贷款数字,以及税号,在美国被泄露了9万人。
3。 安卓
5月份,Android遭到了敌人的攻击。由于云服务大量配置错误,安全专家透露,移动平台上超过1亿人的个人信息被泄露。这些信息是在23个应用程序的不安全实时数据库中发现的,下载数量从1万到1000万不等。调查结果表明,在限制对应用数据的访问时,一些Android开发者没有遵守基本的安全标准。
4。 微软
微软在3月2日表示,它是由中国黑客组织铪发起的由国家支持的网络攻击的目标。 美国有3万多个组织受到袭击,包括地方政府和联邦机构。这是第八次由政府主导的针对市民团体和企业的网络攻击。据微软透露,该组织“主要以美国公司为目标,从大量行业窃取数据”,这是去年披露的。
5。 LinkedIn
6月,领英遭到政府调查,7亿会员的数据被收集并在网上分享。在新闻网站Privacy Sharks确认了100万条数据样本后通知领英之前,数据库交易市场RaidForums的一名成员已经准备好出售这些数据。领英在一份声明中表示:“这不是领英未经授权的访问,我们的审查发现,没有泄露领英用户的私人数据。” 但这样的事情已经不是第一次发生了。 今年4月,5亿领英用户的数据被曝光,尽管这家社交媒体巨头声称所有信息都是公开的,是抓取机器人的结果。
6。 Mimecast
年初,一名技术娴熟的网络罪犯攻击了一份用于验证云电子邮件营销服务公司Office365 Exchange在线服务的同步与恢复、Endurance Monitor和内部电子邮件保护(IEP)产品的Mimecast文件。 据该公司称,微软通知了它的入侵,大约10%的客户使用了暴露的连接,然后被提示重新安装一个新颁发的许可证。
7。 Pixlr
1月,一名黑客还从免费网络照片编辑程序Pixlr窃取了一个包含190万用户记录的数据库。与此同时,另一个图片网站123RF也遭到黑客攻击,8300多万用户的记录被泄露。 电子邮件地址、姓名、密码哈希值、用户国籍和时事通讯订阅信息都被窃取了。
8。 混响
4月被投入暗网后,发现了包括主流乐器市场“混响”超过560万会员个人信息的数据库。真实姓名、电子邮件账户、地理地址、联系信息、订单数量、PayPal账户电子邮件和IP地址都包含在数据库中。 在研究人员发现这些数据并在Twitter上公布后,Reverb客户开始收到数据泄露警告,称用户信息已被泄露。
9。 Accellion
文件传输和协作工具供应商Accellion在1月份发布了4个补丁,以解决恶意攻击者利用其文件传输工具服务攻击客户端的漏洞。不幸的是,勒索软件组织Clop和金融犯罪组织FIN11在17名消费者应用补丁程序之前利用了漏洞,获得了访问客户数据的权限。 受影响的客户包括美国卫生与公众服务部以及加州大学。 就在一个月前,Accellion发现了该服务的零日漏洞,并发布了补丁进行补救。
10。 MeetMindful
1月,MeetMindful的网络约会服务遭到黑客攻击,一个包含228万会员个人身份信息(PII)的1.2GB文件在一个知名黑客网站上被发布。根据该公司的研究,该事件只影响到在2020年3月之前建立或修改账户的客户。被盗的信息包括姓名、电子邮件账户、地理信息、约会兴趣、婚姻状况、出生日期、IP地址、bcrypt -hash密码哈希、Facebook用户名和密码以及Facebook登录令牌。
结论
数据泄露是何时的问题,而不是是否会发生的问题,这是通常的情况。 要比攻击者领先一点,需要确保您的消费者数据的安全性。 企业必须保护用户信息和公司数据,以避免社交媒体数据泄露。 随着提高员工意识和定期更新规则,有效的培训和技术可能有助于降低数据泄露的可能性。