返回首页>>

二手车价格预测





案例整理者:
顾伟业
最后修订:
2020-12-15

任务类型:分类预测

算法:XGBoost;LightGBM

数据源:二手车价格数据集(68M)

下载地址1(used_car_test.csv ) (used_car_train.csv )下载地址2(北大网盘


      背景:2020年3月,Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。赛题以二手车市场为背景,要求选手预测二手汽车的交易价格。比赛官方为赛题定制了系列学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。本次学习的案例即为此baseline方案,案例网址为https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12281897.0.0.683f39a9UBnEaI&postId=95422
      数据集:本案例的数据集由赛事官方提供。数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。比赛从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B(本案例使用测试集B作为实际测试集),同时会对name、model、brand和regionCode等信息进行脱敏。脱敏的方式主要是将之转为无实际意义的数字。

案例分析文档:used_car.docx(390K)

案例分析展示:used_car.pptx(3.7M)

案例分析源代码:used_car.py(5K)