GitHub上编程语言流行度分析

GitHub已然是全球最流行的开源项目托管平台,项目数量目前已经达到了千万级别。Adereth在Counting Stars on GitHub一文提供了一个非常有意思的思路,那就是籍GitHub用户通过星星标记感兴趣项目的数目,来观察GitHub中用户最流行的是什么编程语言。

老规矩,让我们用Power BI来分析一下吧。首先从Adereth的博客下载相关数据,然后用Power Query倒入Power Pivot中。对星星数目做透视图很快就能够知道前20流行语言如下:

更进一步,我们可以在Excel中按照星星数目把编程语言名字生成一段文字,然后通过http://www.jasondavies.com/wordcloud/生成以下文字云图:

个人比较熟悉的Java,半数项目与Android相关,与Object C的火爆相互辉映;C#有点不给力,主要还是集中在服务器方面以及Mono了,乐观一点可以理解为微软转型企业应用开发还是比较成功的。有趣的是,经常有人说企业应用开发多高端,互联网开发好像比较小儿科,但是GitHub上的事实却是相反的。其实很多事是也证明了这个观点,比如大数据等应用都是从互联网兴起然后才被企业引入的。所以,企业开发应该更敏捷更创新,才能够避免固步自封甚至夜郎自大。

文中的Excel文件可以从这里下载。

 



张 琪