机器学习(Machine learning) #
机器学习的分类 #
有监督学习(Supervised Learning) #
这种算法使训练数据和数据反馈来学习给定输入与给定输出之间的关系。
- 从数据源中定义标签和特征
- 通过算法对数据进行训练,找到特征变量与输出之间的联系
- 一旦训练完成,通常表现为在算法足够准确或稳定时,将算法用于新数据
有监督学习通常应用于以下场景:
- 分类 (Classification)
- 垃圾邮件分类:根据电子邮件的内容,将邮件分类为垃圾邮件或非垃圾邮件。
- 图像分类:识别图片中是否包含某个对象(如猫或狗)。
- 情感分析:基于用户评论内容,判断情感是正面还是负面。
- 信用风险预测:根据用户的财务数据预测是否会违约。
- 回归 (Regression)
- 房价预测:根据房屋面积、地理位置等预测房价。
- 天气预测:根据历史数据预测未来的气温变化。
- 股票价格预测:基于市场数据预测未来的股票价格。
- 销售量预测:根据产品的价格、广告支出等,预测未来销售量。
- 序列预测 (Sequence Prediction)
- 语音识别:将语音转化为文本。
- 时间序列分析:如预测股市趋势、用电量需求等。
- 机器翻译:将一段文字从一种语言翻译成另一种语言。
无监督学习(Unsupervised Learning) #
这种算法在不提供明确输出变量的情况下探索输入数据的模式和规律。
- 算法接受未打标签的数据
- 算法根据数据推断出数据结构与模式
- 算法会识别那些表现出相似行为的数据组
无监督学习更偏向于数据的探索和结构分析,常用于以下场景:
- 聚类 (Clustering)
- 客户分群:基于购买行为,将客户分为不同群体以制定差异化营销策略。
- 图像分割:将一幅图片分成具有相似像素的不同区域。
- 基因分组:根据基因相似性对人类基因进行聚类分析。
- 用户行为分析:对用户访问网站的行为数据进行分群,识别常见的使用模式。
- 降维 (Dimensionality Reduction)
- 特征提取:在大数据集中特征选择与简化,保留重要信息(如PCA主成分分析)。
- 数据可视化:将高维数据降维到二维或三维,便于人类理解。
- 压缩图像数据:减少图片文件大小,同时尽量保留主要视觉信息。
- 关联规则挖掘 (Association Rule Learning)
- 市场篮分析:发现购物者经常同时购买的商品,例如购买面包时更可能购买黄油。
- 推荐系统:基于用户的历史行为,推荐可能感兴趣的商品(例如Netflix、亚马逊的推荐算法)。
- 网络入侵检测:通过识别网络流量中的异常模式,检测潜在的入侵。
强化学习(Reinforcement Learning) #
这种算法通过最大化动作锁获得的回报来学习执行任务。
- 该算法针对环境定义动作
- 收到动作的奖励后,算法会逼近最大化可用的总讲理
- 随着时间的流逝,算法对其自身进行校正,并不断优化最佳操作序列
例如:
- 机器人学习走路 - 机器人通过尝试和调整步伐,最终学会保持平衡并走得越来越稳。
- 游戏AI打怪升级 - 游戏中的AI学会通过打怪获得积分,不断优化打怪路线,提升通关效率。
- 自动驾驶避障 - 自动驾驶汽车通过强化学习学会安全避开障碍物,并选择最佳行驶路径。
- 推荐系统 - 流媒体平台(如视频网站)根据用户喜好,学会推荐更吸引人的电影或视频。
- 投资收益优化 - 算法根据市场动态,实时调整投资组合,让投资回报最大化。
- 交通信号灯优化 - 信号灯通过强化学习自动调整红绿灯时长,减少交通拥堵。
- 节能空调控制 - 空调通过强化学习控制温度和风速,在节约能源的同时保证舒适性。
- 自动化药物剂量调整 - 系统根据病人的反馈优化药物剂量,提升治疗效果。