3

用Hive玩转维基百科

众所周知,Hadoop提供了基于廉价硬件实现大规模并行处理的能力,利用这套技术模仿谷歌存储并计算整个互联网也不是难事。不过,简单的查询都要写MapReduce代码,对于商业用户实在不怎么友好,毕竟,程序猿不是谁都可以当的。为了解决这个问题,Hive应运而生。本质上,Hive是一个… 继续阅读

2

使用百度开放云分析网站日志

网站日志包含用户访问信息,通过日志分析我们可以了解网站的访问量、网页访问次数、网页访问人数、频繁访问时段等等,以便获取用户行为以优化网站的商业价值。由于网站每天会产生海量的日志,非常适合使用百度MapReduce(简称BMR)这样的托管Hadoop服务。同时,BMR集成了Hive… 继续阅读