他发现:
? 温度越高,卖出的柠檬水越多。
? 天气越晴朗,卖出的柠檬水也越多。
? 湿度太高时,人们反而不太想买柠檬水。
他收集了一些数据,比如:
? 昨天 30°C,卖出 50 杯
? 昨天 35°C,卖出 70 杯
? 昨天 28°C,卖出 45 杯
他想建立一个预测模型,比如:
这样,如果明天预测是 32°C,他可以计算:
那么,他就应该准备大约 76 杯柠檬水。
这个过程就是回归问题——它的目标是预测一个连续的数值,而不是一个固定类别。
回归问题的典型特征:
答案是一个数值,而不是分类标签(如“明天卖 76 杯”而不是“卖得多”或“卖得少”)
数据之间有连续性的关系(温度从 20°C 到 40°C,销量随之变化)
最终输出是一个数值预测(如“销量=76”)
现实中的应用:
? 预测房价(基于面积、地段等因素预测房价)
? 预测股票价格(基于历史数据预测未来走势)
? 预测某人未来的收入(基于年龄、教育、工作经验等)
用比喻解释分类问题和回归问题