机器学习实验报告
〇. 实验报告pdf可从本网站下载
这个需要积分下载(因为后台会检查实验报告是否抄袭,不建议直接免费去)。
建议阅读博客。 博客中会有很多实验报告和小解释,会用[…]粗体注释。
一、实验目的及要求
(1) 实现基本的线性回归算法来预测简单的数据; 参考相关论文和文献,实现3-4篇现有论文中的回归算法,并比较其在人脸识别方面的性能
(2)自己设计一个全新的线性回归算法(不是来自别人的论文!而是自己创造的!),包括建模和优化、收敛性证明等(如果有的话)。 要求:你开发的新算法可以用于人脸识别实验中的识别率可以优于基本的或现有的线性回归算法(至少在23个数据库中更好,在其他12个数据库中基本相似)。 全面比较你的方法和你的复现方法在不同维度的识别率。 (本创新内容可单独撰写论文提交至“论文提交办公室”)
以上内容不应超过3-4页。
思考题题目:机器学习股价预测大PK—–论即日起至6月30日上午收盘价最大的锂电池相关行业个股
这部分需要不少于4页,长度没有限制(但不应超过20页)。 要求关键数据详细、图表丰富、有理有据、引用清晰(给出网址、报告名称、作者姓名,就像引用论文一样)。 最后选出涨幅最大的股票及其涨幅(以4月17日收盘时的实际价格为准)。 内容或技术没有限制。 可以使用任何机器学习技术,包括但不限于线性、非线性、多项式、多变量函数等各种预测模型。 你也可以什么都不用,用一个数据列表来解释原因。 (建模时可以考虑月度需求、产量、价格、进口量、疫情等因素之间的关系。)
建议各组学生分工合作。 每个人收集2-3只股票的关键可靠信息,进行信息汇总和小组讨论,最后做出自己的预测。 通常每个人都有不同的看法,所以预测值很难完全相同! 。 各组统一意见选出最具投资价值的股票,并给出预计涨价(2022年6月30日中午收盘,这是我们最后一堂课)。 每个小组公开选派一名学生报告小组的研究成果,每人大约需要15分钟。 我们利用一下午的实验课时间来汇报PK。 要求是:模型、图表、数据都很详细。
本节的最后一句以以下句子结尾:
短期内,我建议买入****(股票名称)。 4月15日交易日价格为元。 截至6月30日/7月6日的价格(以最后一交易日下午收盘价为准)为人民币。 增幅为**%。 预报员姓名:***
长期(2020年末、2021年、2022年)建议买入****(股票名称),4月15日交易日价格为元,其预计价格至(2020年末、2021年12月30日) 、2022年)分别为(、****、****元),增(减)幅分别为(**%、*%、%)。 预报员姓名:
把这段照片保存在手机里,以便到时候可以出示证据领奖! ! 预测最准确的老师将获得神秘奖品! ! ! ) 请记住您提交的报告的最终价值并拍照。 以上收盘价以3天为准(以6月30日最后一堂课下午为准)。
2.实验内容与方法 2.1 线性回归算法的学习与复习 2.1.1 线性回归原理
2.1.2 单变量线性回归模型
2.1.3 多元线性回归模型
2.2 线性回归算法实现简单预测
3. 实验步骤及过程 3.1 人脸识别中线性回归和现有论文中回归算法的性能对比 3.1.1 实验数据集、训练集和测试集的划分
ORL56_46人脸数据集
这个数据集中有40个人,每个人有10张照片。 每幅图像的像素大小为56×46。 在本实验中,数据集的每个类被分为5个训练集和5个测试集,使用40个类。
AR人脸数据集
数据库由3个以上数据库组成; 126 名受试者的 200 张正面面部图像的彩色图像。 每个主题有 26 张不同的图片。 对于每个受试者,图像被记录在两个不同的会话中,相隔两周,每个会话包含 13 张图像。 所有图像均由同一台相机在严格控制的照明和视点条件下拍摄。 数据库中的每张图像尺寸为768×576像素,每个像素由24位RGB颜色值表示。 在本实验中,数据集的每个类别被分为13个训练集和13个测试集,并使用前16个类别。
FERET 人脸数据集
该数据集共包含200人,每人7张图像,分类卡通形象,灰度,80×80像素。 第一张图是没有变化的标准图像maya苹果建模实验报告,第二张和第五张图片是姿势变化较大的图像,第三张和第四张图片是姿势变化较小的图像。 第七张图是光照变化的图像。 在本实验中,数据集的每个类别被分为4个训练集和3个测试集,使用200个类别。
3.1.2 实验步骤 1. 线性回归分类算法LRC
2.岭回归
3.套索返回
3.1.3 实验结果
3.1.4 实验结果分析
通过比较几种应用于人脸识别的方法,我们发现回归模型的人脸识别率比较高。 LRC、岭回归、Lasso回归根据是否添加正则项以及添加什么样的正则项有不同的算法。 不过,通过我的实验,我可以发现人脸识别方面的差距并不是很大。
4.思考问题
【预测很不准,丢人现眼! ! ! 】
4.1 首先了解当前半导体股价
宁德时代
毫无疑问,电池是新能源汽车发展的重中之重。 现阶段电动汽车最紧迫的问题就是续航,而对续航影响最直接的就是电池。 目前,在整个新能源动力电池行业,宁德时代无论是国内还是国际都是领先者。
比亚迪
自2003年收购秦川汽车以来,比亚迪开始了造车之旅,并逐步发展成为中国最大的新能源汽车公司。
国轩高科
目前,国内锂电池上市公司中,国轩高科是一家主要以磷酸铁锂技术路线为主的动力生产公司。 国轩高科在国内企业中排名行业第三,属于动力电池企业第二梯队。
亿纬锂能
亿纬锂能虽然与宁德时代、比亚迪一样大,但同样专注于锂电池的创新发展。 经过这么多年的努力,锂子电池走在了世界前列,锂一次电池在国内也处于领先地位。
鹏辉能源
鹏辉能源主要生产聚合物锂离子、锂离子、镍氢等二次充电电池; 以及锂铁、锂锰、锌空气等原电池。 产品广泛应用于移动电源、航模、新能源汽车、汽车启动电源、同心基站备用电源、风能太阳能储能及家庭储能电池系统解决方案。
4.2 导出库存数据
目前量化平台有很多,其中JoinQuant量化平台就受到了好评。 本次股票预测将使用JoinQuant平台和Python API导入股票数据。 JQData是聚宽数据团队专门为对量化投资感兴趣的金融机构、研究人员以及个人量化爱好者提供的本土量化金融数据。 用户只需在本地Python环境安装JQData数据包,输入三行代码,即可调用聚宽数据团队专业制作的全套量化金融数据。
首先需要手动安装压缩包:
然后将数据导出到.cvs文件,查看数据结果如下图:
4.3 可视化库存数据
首先,我将已知的数据可视化,对各个半导体行业的股价走势做了初步分析。
4.4 预测模型
我使用改进的时间序列 ARIMA 模型来预测股票行业趋势。
ARIMA模型(Autoregressive Integrated Moving Average model),微分综合移动平均自回归模型,又称综合移动平均自回归模型(移动也可称为滑动),是时间序列预测分析方法之一。 在ARIMA(p,d,q)中,AR是“自回归”maya苹果建模实验报告,p是自回归项的数量; MA 是“移动平均”,q 是移动平均项的数量,d 是使其成为平稳序列的差异数量。 (命令)。
首先,某一天股市价格的影响取决于近几个月的走势。 距离预测时间越近,影响就越大。 我认为股票走势也可能受到往年同期的影响。 一年的走势有一定的周期性,所以我考虑在ARIMA模型的基础上加上往年同期的内容。
ARIMA模型的具体理论知识在实验报告中不再描述。
4.5 预测结果显示
4.5 上述预测结果分析
利用预测模型,预测2022年4月五家半导体公司的市值为
预测表:
短期和长期损益预测:
短期内,我建议买入CATL(股票名称)。 4月15日交易日价格为5949元。 截至6月30日/7月6日(以最后一交易日下午收盘价为准)的价格为8816元,涨幅为18.37%。预测员姓名:王北奇
从长期来看(2022年底、2023年和2024年),我建议购买CATL(股票名称)。 4月15日交易日价格为5949元。 预计(2022年底、2023年、2024年12月30日)价格为(16985、22663、27066元),增(减)分别为(185.51%、280.95%、354.96%)。预测者姓名:王北汽
5.实验结论或经验
这个实验报告是关于线性回归的。 实验过程中,线性回归可以作为拟合工具,也可以解决分类问题。 在人脸识别实验中,我们知道PCA和LDA+KNN分类器是通过降维和重构来进行人脸识别的。 对于回归算法来说,相似之处在于重构的思想。 但不同的是,回归算法本身可以作为预测模型,不需要降维,而是被赋予一定的权重。 除了多元线性回归之外吉祥物,回归算法还包括:岭回归、Lasso回归等回归模型。 这些与线性回归的区别在于是否添加正则项以及添加什么样的正则项。 对于人脸识别的任务,线性回归、岭回归、Lasso回归的识别率差别不大。
这份实验报告的另一个任务是预测股票价格。 该问题的解决方法如下: 1)首先选择半导体行业,导出库存数据。 我使用聚宽的 JQDATA API 使用 Python 导出其数据。 2)然后进行数据处理,将日信息转化为月信息,以便于分析。 3)接下来,设计一个预测模型来预测这个行业股票的市值,并利用2021年之前的数据来预测和验证2021年的股价。 4)最后,预测结果以及长期的市场价格和期权并给出短期预测。
这篇实验报告时间长,内容丰富,而且我对量化金融也很感兴趣。 ARIMA模型也是数学建模中常用的算法。 时间序列的本质是线性回归,因此经过改进后,将其用于股票预测是有一定说服力的。
- 本文固定链接: https://wen.nuanque.com/maya/20469.html
- 转载请注明: nuanquewen 于 吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计 发表
- 文章或作品为作者独立观点不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。本文之内容为用户主动投稿和用户分享产生,如发现内容涉嫌抄袭侵权,请联系在线客服举报,一经查实,本站将立刻删除。本站转载之内容为资源共享、学习交流之目的,请勿使用于商业用途。