二手车价格预测
- 案例整理者:
- 顾伟业
- 最后修订:
- 2020-12-15
任务类型:分类预测
算法:XGBoost;LightGBM
数据源:二手车价格数据集(68M)
下载地址1(used_car_test.csv ) (used_car_train.csv )下载地址2(北大网盘)
 背景:2020年3月,Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。赛题以二手车市场为背景,要求选手预测二手汽车的交易价格。比赛官方为赛题定制了系列学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。本次学习的案例即为此baseline方案,案例网址为https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12281897.0.0.683f39a9UBnEaI&postId=95422  数据集:本案例的数据集由赛事官方提供。数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。比赛从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B(本案例使用测试集B作为实际测试集),同时会对name、model、brand和regionCode等信息进行脱敏。脱敏的方式主要是将之转为无实际意义的数字。