2023 杭州 · 亚运会数据可视化分析
2022 卡塔尔 · 世界杯数据可视化分析
历届世界杯基础数据分析
历届世界杯基础数据
该表包含的字段有:
届次、赛事名词、年份、举办地点、开始时间、结束时间、冠军、亚军、季军、殿军、总进球数、总参赛队伍数、总比赛场次、现场观众总人数、举办国所在州以及冠军队伍所在州
数据预处理
补全数据:观察数据表发现,原始数据表中缺乏2022年卡塔尔世界杯数据,因此手动将该行数据上传,截至目前,卡塔尔所有比赛结果均以出炉,不过对于现场观众总人数数据,还尚在统计。
归一化处理:第一届世界杯于1930年举办,至今已经92年,很多国家经过了历史的洗礼,其名称已经发生改变,亦或是该国家已经解体,如苏联。因此,为了在后面可以使用地图图表,对部分国家名进行了处理。如东德、西德和联邦德国统一为德国,捷克斯洛伐克更改为捷克。如果数据存在严重错误,可以联系我们
世界杯基础数据流
通过对开始时间和结束时间进行计算,得出历届世界杯的持续时间。然后对个别命名存在偏差的国家值进行修正,以方便后面匹配国家代码。通过case语句对东道主名次进行判断,此处只计算四强名次,如果没有进入四强,则统一为0。由于17届世界杯是韩日一起举办的,为了在地图上展现处理,因此需要将17届数据列为两行。后续在做计算处理时,只需要当作一行(世界杯基础数据)。
历届四强队伍数据流
对原始数据表进行逆透视,得到历届四强队伍,然后将四强队伍与国家地区代码匹配,获得四强队伍的国家代码。