南方日报 | 华傲数据:技术与商业模式双重创新
摘要: 华傲从大数据产业链的数据整理环节切入,拥有全球领先的数据整理提炼技术。目前,除了将大数据创新技术应用于智慧城市以及金融创新外,华傲也在积极与互联网有机结合。

华傲数据团队部分成员。受访者提供
2013年《哈佛商业评论》一篇题为“谁来引领中国大数据的发展”的研究报告,给出了当今世界大数据各信息处理环节中企业占位图。IBM、ORACLE、Intel等国际著名公司名列其中,中国仅有三家被列入,分别为百度、腾讯和华傲。其中,华傲是数据整理领域唯一入围的中国企业。
华傲CEO贾西贝表示,华傲从大数据产业链的数据整理环节切入,拥有全球领先的数据整理提炼技术。目前,除了将大数据创新技术应用于智慧城市以及金融创新外,华傲也在积极与互联网有机结合。“技术与商业模式的双重创新,再插上互联网的翅膀,势必让大数据资产创造前所未有的价值”。
应用▶▷让数据多跑腿群众少跑路
“数据也分优劣,举个简单的例子,一个班级每个同学各科的考试成绩就是一组好的数据,如果缺失了几个同学信息或者某科成绩登记错了,就是不好的数据。而在现实海量数据中,很多数据都是缺失、错误或者重叠的,我们华傲一项核心技术就是数据淘金,将海量垃圾数据清理提炼成有价值的数据资产。”华傲数据科学家徐磊用一个日常例子来解释数据提炼究竟是做什么。
目前,华傲的大数据整理技术已经广泛应用到政府和金融机构。据贾西贝介绍,华傲从2011年开始为包括深圳市政府、中信银行、深圳电信近100个客户提供产品解决方案。“其实政府的数据资产是最庞大的,目前只露出了冰山一角,像智慧城市、智慧交通等与民生密切相关领域还有巨大潜力。”
作为深圳电子政府合作伙伴,华傲从2012年开始参与了深圳智慧城市“织网工程”建设。将深圳全市四十多个委办局的数据进行集中提升,从而构建人口、房屋、法人三大基础数据库,为民生服务、社会管理和政府决策提供数据支撑。贾西贝透露,仅仅是人口这项数据就是一个庞大复杂的工程。“任何数据来源肯定都会有问题,而且政府各部门间存在数据重叠过期等现象,我们要把错误重复的数据转变为可用的状态。”
其中,关于外来人口积分入户最受外界关注。以往调研,外来人口入户需要跑大概15个部门开具证明才能完成。华傲通过搭建公共基础信息资源库,将各个行政机关部门信息整合资源共享,今后市民就可以在一个单位直接办理。“我们的宗旨就是让数据多跑腿,让群众少跑路,让‘证明你妈是你妈’这样的事情将不再发生。”
金融机构,则是华傲另外一类主要客户。“最近股票暴涨暴跌,一旦系统响应速度慢,就会遭到股民投诉,证券公司压力非常大。”贾西贝表示,用户的登录和操作行为就是一种系统日志,以往没有作为数据资产长久管理,现在很多证券公司都意识到了日志数据管理的重要性。“全国最大证券公司之一就通过华傲来管理日志数据,对趋势进行预测,预防系统故障。”
发展▶▷自主知识产权全球领先
在业界,一般把大数据产业链分为以下几个环节:数据采集、数据清理、数据存储与管理、数据分析以及数据可视化。第一个环节数据采集是现在很多科技巨头都在做的,比如谷歌、百度、腾讯,而华傲所做的数据清理正是大数据产业链中较少企业涉及的。
走进华傲会议室,你会发现每间都按照国际数据计量单位命名,比如“ZB、PB”,仿佛进入了一个数字世界。其中一间创新团队会议室,由全球顶级数据科研人员构成,包括荣获英国爱丁堡皇家学会(苏格兰科学院)院士公司樊文飞、贾西贝、徐磊以及曾在Facebook任数据和社交网络研究员于文渊等。
“创新团队就是华傲的最高智囊团,每周来自海内外不同的科研专家在这间会议室探讨最前沿的技术。”贾西贝告诉记者,创新团队已经与哈工大、北大等高校建立了产学研基地。截至目前,公司在大数据等申报了国内发明专利81项、国际专利 30项,主导或参与编制国家地方等标准8项。2007年至2010年,华傲创始团队连续4次获得国际数据领域三大顶级会议最佳论文奖。
“我们的核心竞争力之一,就是利用量质融合技术在凌乱分散的系统中整理出高质量高价值的数据资产。”贾西贝表示,大数据包括质量和数量两个方面,而数据质量管理是大数据最关键的技术之一。
而以往的数据处理方采用DBMS技术反应时间快,但吞吐量低。主流的Hadoop数据技术虽然吞吐量高,但反应速度慢。华傲的数据技术则采用纯内存迭代运算,不仅吞吐量大,而且反应迅速。贾西贝做了一个比喻,“Hadoop技术与传统技术相比,就像大秦铁路上的重载火车与法拉利跑车,而我们华傲数据技术更像是高铁”。
在华傲内部有一间办公室命名为“光明顶”,每当技术团队遇到了难关都会进去里面讨论,就像武侠小说里高手们修炼武功找一个隐蔽的地方“闭关修炼”。徐磊告诉记者,有时候团队甚至通宵四天完成一项技术难题,研发人员在凌晨四五点发朋友圈感慨“又天亮了”。得益于团队的不懈努力,目前华傲拥有全球领先的大数据管理自主知识产权。
转型▶▷软件公司迈向互联网公司
“全球范围来看,软件的浪潮已经过去,微软、Oracle不再是佼佼者,Facebook、Twitter等互联公司才是未来大势。以大数据技术立命的企业,正在由软件公司向互联网公司转型。”谈及华傲以及大数据的发展趋势,贾西贝做出了以上大胆的预判。
贾西贝认为,中国有世界级的硬件公司,比如华为、联想;也有世界级的互联网公司,比如BAT,但还没有出现一家世界级的软件公司。他分析指出,第一是知识产权环境的问题;第二是软件外包产业不像印度那样发达;第三是整个软件行业处于黄昏。“在这样的大背景下,华傲希望通过大数据技术与互联网商业模式的双重创新,颠覆未来大数据发展。”
目前,华傲正通过两条腿来走路。在金融和政府等传统领域,华傲是创新的技术+传统的商业模式。而在新兴互联网领域,华傲是创新的技术+创新的商业模式。除了大数据的整理提炼,华傲还将触角伸向了数据资源获取以及数据价值变现。
利用爬虫技术获取网络数据,是近四年来华傲一直在做的事情。贾西贝表示,目前国内BAT三家企业几乎垄断了大部分数据资源。“我们能做的就是把互联网上其他的数据收集起来,把眼睛看得见的没有隐私的数据通过众包模式采集起来,与巨头错位竞争。”
华傲正在内测一款“随手赚”的数据采集众包APP,即人人都是数据采集员。每一个用户通过随手拍照上传数据,完成任务获得相应奖金。在贾西贝看来,这种众包概念的互联网商业模式类似滴滴打车,每一个人都可以成为你的数据采集员,积累的数据是惊人的。“畅想一下,如果未来APP拥有中国每一栋房屋的基础数据,困扰多年的房屋空置率问题或许一下子就可以解决。”
对于“随手赚”数据采集的商业模式,贾西贝以及投资人都非常看好,认为其既可以流量变现,也可以数据变现。贾西贝团队认为,大数据对于移动互联网、O2O以及互联网金融将产生颠覆性的影响。此外,华傲也在研发将基于大数据信用评分推出移动互联网消费金融产品“随手借”,为用户提供小额借款服务。
贾西贝透露,2014年公司已取得了千万级的主营业务收入,今年预计稳步增长。此前已引入东方富海等3家风投机构4000万元资金,B轮融资正在洽谈中,很多投资机构抛来了橄榄枝。“但放眼国内,互联公司估值远远高于软件公司。同样的创新技术,与不同商业模式结合时估值差异巨大,这也是华傲向互联网转型的原因。让大数据创新技术插上移动互联翅膀,创造的价值将不可想象。”
