返回首页>>

澳大利亚降雨预测





案例整理者:
金笑缘
最后修订:
2020-12-15

任务类型:分类预测

算法:SVM支持向量机

数据源:寿命预测数据集(2M)

下载地址1(dataset.csv ) 下载地址2(北大网盘


      背景:天气预报是使用现代科学技术对未来某一地点地球大气层的状态进行预测的技术。今天的天气预报主要是使用收集大量的数据(气温、湿度、风向和风速、气压等),然后使用目前对大气过程的认识科学(即气象学)来确定未来气象变化。 日常生活中,不考虑农业应用需求,天气预报对人们而言最大的信息需求往往集中在“是否下雨”,因为降雨是除了自然灾害之外最容易对外出活动造成影响的天气现象。因此本选题“澳大利亚降雨预测”的目标就是模仿短期天气预报过程,综合澳大利亚多项气象信息的数据,对天气预报中最重要的一项“明天是否降雨”进行分类预测,具有较高的应用意义。
      数据集:本项目使用数据集下载自Kaggle平台,数据包含了来自澳大利亚多个气候站的日常共近150000条的气象数据,每个记录拥有22个字段(数据集字段见下表),前21个字段为记录属性,最后一个字段为预测字段:第二天是否下雨。数据集较为完整,即便进行了严格的数据清洗,依然具有较大的数据量,以至于进行SVM算法进行计算时不得不使用欠采样方法降低数据集数量。

案例分析文档:weather.docx(253K)

案例分析展示:weather.pdf(600K)

案例分析源代码:weather.ipynb(289K)