0

用数据可视化来规划度假

每逢小长假去哪儿都是一个问题。虽然百度百科提供了国家AAAAA级旅游景区,但是并不直观,下面我们借助Qlik来把数据可视化,帮助规划度假。

Qlik是国际最著名的三大自助式BI厂商之一,Qlik Sense是针对非技术人员设计的简易型BI工具,提供免费的桌面版本。

添加数据

在新建的应用中选择添加数据,在连接我的数据中选择“Web文件”,URL填写国家AAAAA级旅游景区的网页地址,名称写“国家5A级旅游景区”,选择“@2”即第二个表格元素、字符集为UTF-8,最后勾选除“数量”三列,就可以顺利选择原始数据了,最后选择加载并完成:

qlik-sense-tour-01

编辑数据

刚才导入的数据有些小问题,那就是景区名称挺混乱的,有的用中文括号注释,有的用西文括号注释,需要使用Qlik脚本语言预处理一下。

切换到数据加载编辑器,点击“自动生成的脚本段”,可以发现Qlik已经通过脚本完整描述了刚才的UI操作。点击解锁,把代码替换成:

[@2]:
LOAD [省份],
	IF (FindOneOf([景区名称],'(('),
        Left([景区名称],
        FindOneOf([景区名称],'((')-1),
    [景区名称]) AS '景区',
    Left([评定年份],4) AS '年份'
FROM [lib://国家5A级旅游景区]
(html, utf8, embedded labels, table is @2);

RENAME TABLE [@2] to AAAAA;

修改很简单,就是截取中西文括号的左边文字。Qlik脚本语言很强大,可以参考Script Syntax and Chart Functions Guide深入了解。

创建工作表

点击我的新工作表,选择编辑,拖拽条形图到桌布,维度选择“省份”,度量项选择“Count([景区])”,便可以生成下图:

qlik-sense-tour-02

很明显,江浙沪地区5A级景区数量最多,非常合适假期自驾游!

此外,还可以添加透视图,依次选择“省份”和“景区”作为行数据,用景区数量降序排序,以便了解省市所包含的5A景区,果然好多地方还没有去过呢:

qlik-sense-tour-03

地图

这样的可视化虽然很自由但仍显干涩,结合地图显示出来就会大不同。

由于Qlik并不支持自动在地图标出景区,所以请下载位置.csv,其中包含了通过百度地图获取的5A级景区的经纬度。

同样地,添加数据,这次选择“符号分割的文件”,导入文件如下:

qlik-sense-tour-04

之后需要通过编辑数据告诉Qlik以合并两个字段成为地理位置:

LOAD *, GeoMakePoint([纬度],[经度]) as 经纬度;

LOAD
    景区,
    经度,
    纬度
FROM [lib://SiteSeeing/位置.csv]
(txt, utf8, embedded labels, delimiter is '\t', msq);

数据导入之后,Qlik会非常智能地把两个数据集通过“景区”这个字段关联起来,所以我们可以直接添加地图,维度选择“经纬度”即可:

qlik-sense-tour-05

当然,要是能够结合百度搜索显示景点图片、调用百度旅游预测客流,那就更方便了。

有了数据可视化的帮助,规划下个假日旅行方便多了吧?

 



张 琪

发表评论

电子邮件地址不会被公开。 必填项已用*标注