近两年,很多企业都开始关注数据价值,这和大数据的兴起不无关系。那么,何为大数据?大数据到底有多大?一组数据可以说明。
2010年,我国新存储的数据为250PB,2012年则达到364EB,约为日本的60%,北美的7%。2011年,全球数据规模为1.8ZB,到2020年,全球数据将达到40ZB,如果把它们全部存入蓝光光盘,这些光盘和424艘尼米兹号航母重量相当。大量新数据源的出现则导致了非结构化、半结构化数据爆发式的增长。信息数据的单位由TB级发展到PB、EB、ZB级别。
综合来看,大数据是各行各业的信息爆炸引发的信息变革,这些行业包括互联网、移动互联网、金融、交通、电信、车联网、物联网等。由社交网站、搜索引擎以及电商组成的互联网行业存在着大量数据,如果对这些数据进行价值挖掘,将让整个行业获得更好的发展。同样,银行、股市、保险以及负责安全监控的交通行业,包含大量通话和短信的电信行业……如果对这些行业的数据合理利用,必将带来非常可观的社会效益和经济价值。
但实际上,要想真正获得大数据价值,挑战重重。一方面,数据量大、存储难、查询慢、数据安全无法保证等问题,让大数据无法有效利用;另一方面,没有一套完整的解决方案或者可参考的优秀案例,能够更好地挖掘数据的潜在价值,让数据更好地为我们服务。
所以,大数据带来了一大批专注于数据挖掘与分析解决方案提供商的崛起,萨纳斯就是这样的企业之一。
最近,萨纳斯又有了新动作,主推SDP(Sarnath Data Platform )大数据基础平台。据了解,SDP是通过Apache Hadoop实践经验,基于开源社区进行增强的企业级大数据存储、管理、查询及分析一体化平台,提供系统化专业化大数据行业解决方案,是为客户量身定制的专属的数据管理分析架构。
SDP框架图
那么,问题来啦。萨纳斯的SDP大数据基础平台为何要基于Hadoop开源技术?
1、为什么是Hadoop?
过去,能提供数据处理的软件、硬件,或者能提供技术和解决方案的公司,主要集中在SAP、IBM一类的公司。但从咨询到实施,一整套下来,一般企业很难承受得起。最重要的是,也无法满足海量数据存储与计算要求。所以,Hadoop技术兴起。
由于Hadoop最擅长高效处理海量规模的数据,并且是一个开源平台,所以受很多开发者热捧。
如今,提起大数据,我们很自然地想起Hadoop。Hadoop包括并行计算模型MapReduce、分布式文件系统HDFS,以及任务调度YARN,同时与Hadoop相关组件也很丰富,包括Hbase、ZooKeeper、Pig、Flume、Hive、Mahout等,这些项目使得Hadoop成为一个非常大的生态系统。
但是开源技术有一个缺点,就是应用的不够稳定,功能不够细化,所以衍生了Hadoop以及相关业务的公司。此种背景下,萨纳斯SDP顺势而生。
2、为何看重基础平台?
随着大数据在各行各业的落地,大数据市场开始深化发展,大数据行业也因此被细分。大体来看,大数据被分为三层:底层基础平台,中间层通用技术,上层行业应用。
目前,专注中间层通用技术及上层行业应用的企业有很多,但专注底层基础平台的企业却不多。底层基础平台主要解决的是数据存储、计算的问题,是大数据的基石。这一层非常重要,同时也是技术含量最高的一层。因为采集到的数据,首先要能高效、快捷地存起来,才能进行数据分析和挖掘。
为了帮助用户打造核心竞争力,最终实现用户效益最大化,萨纳斯推出SDP大数据基础平台。自此,萨纳斯可以为企业提供从数据采集、数据清洗、数据存储、数据分析、数据挖掘到数据可视化展示的全套解决方案。
3、SDP为客户带来哪些价值?
具体来看,SDP包括五大部分,包括:设备接入层,存储和计算层,服务层,应用层,展现层。该平台可以多元化、多协议数据接入。在存储和计算能力方面,SDP表现更加卓越,企业可以实现分布式存储,并能进行流式计算和分析。如果企业有更个性化的用户需求,也没关系,SDP行业定制开发与展示能力可以更好地满足。SDP不仅可以实现多终端展示,还能支持所有主流数据的数据分析和操作。
推出大数据基础平台,萨纳斯不是第一家企业。但与同类产品相比,萨纳斯SDP的优势非常明显:
1、可视化快速搭建平台;
2、可支持多种数据源接入,满足企业多样化的业务场景;
3、数据挖掘能力更强,可通过机器学习类库与SDP深度集成,能提供多种算法;
4、权限控制更灵活,可基于组件的角色控制,甚至可以通过设置控制到数据;
5、该平台是萨纳斯自有著作权技术,能提供全方位服务;
6、可提供完善的售后服务,包括全天候的求助应答和免费的内部培训。免费备案服务机制让用户无需担心售后问题;
7、团队技术实力雄厚。平台开发团队由国家大数据高级工程师带领200人大数据研发团队组成,40%成员拥有6年以上的大数据开发经验;
8、可根据业务特点定制计算模型,高效洞悉市场需求和业务痛点。
以光伏电站监控平台为例。光伏行业数据量大,查询较慢,运维人员投入太多,人员成本持续增高,设备安全事件处理不及时,导致后果比较严重,业主对发电收益不明朗。基于SDP的光伏电站监控平台通过收集不同传感介质传输过来的光伏组件数据(电表,汇流箱,逆变器,交流柜,气象仪等),通过实时监控和分析,对光伏电站进行完整,统一的检测和控制,并能通过历史数据分析电站各项运行指标和状态,为提高发电量和发电效率提供数据支持和决策指导。目前已应用于全国28省市,装机容量1.5GW的智慧电站运行维护中。
总结来看,“让数据更有价值”成就了萨纳斯;而专注于大数据基础平台,让这家公司具备了独角兽公司的潜力。相信,随着大数据的深化应用,萨纳斯以及SDP平台会获得飞速发展。
FR:索比光伏网
特别声明:索比光伏网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。凡来源注明索比光伏网或索比咨询的内容为索比光伏网原创,转载需获授权。
图片正在生成中...
近两年,很多企业都开始关注数据价值,这和大数据的兴起不无关系。那么,何为大数据?大数据到底有多大?一组数据可以说明。2010年,我国新存储的数据为250PB,2012年则达到364EB,约为日本的60%,北美的7%。2011年,