文章8
标签3
分类4

2023 MCM总结(2-17 6:00—2-21:9:00)

这是我第一次参加美赛,不知道会不会是仅有的一次,感觉是依旧很累但也很开心,我在本次建模的工作很简单,只有三个身份:担任建模手,代码工人,还有写作机器;特此记录!

2023 MCM总结(2-17 6:00—2-21:9:00)

工具总结

$\LaTeX$ & Overleaf

GitHub & Kaggle

PPT

Endnote

Python & R & MATLAB

2-17 Day 1

美赛是早上六点出的题目,好的是大三了我们在周五只有一节课(向老师请假了),然后周一直接没课,给了我们充足的时间,专心来Modeling。

我是早上八点到的申请的场地,拿到题目后,简要阅览每个题目汉化中文大意后,没有咋犹豫,决定选择C题,最开始虽然看的机器翻译,但决定选择题目了之后,我觉得必须还是要选择查看英文原题,一是机器翻译很有可能不准确,一般来说越简单的句子,机器翻译的往往更加准确;二是题目中提到的专业术语或者针对本题的一些名词,自己在写作的时候需要用到,否则就显得很不专业。

其实在第一天就想到了全部问题的求解思路,但主要还是前两问的一个方法,后来两天我也逐渐的对我的建模方法不断改进。

image-20230222235210220

对于第一问,建模解释Wordle玩家人数波动,并且预测2023年3月1日的玩家数量的区间,首先其实我想到的是一些统计学或者机器学习算法,但越想月不合理,根本没有实际的意义。最后还是SIR模型给了我启发,也许微分方程模型是好的,最后决定选择的是Logical增长模型,后期参考一篇文献,又进行了改进,参数求解后,拟合效果也很好,并且具有实际意义,能描述出一般新事火爆后又热度下降,但作为一款游戏,热度也不至于为0。

image-20230222235112351

final predict

对于第一题的第二问个人感觉和前一小问关系不大,反而与Q2,Q3,更加相关一点,所以在写作的时候,我们的目录是这样的:image-20230222235730927

image-20230222235827627

我觉得这样的逻辑思路会更加清晰。

对于第二问我计划对得分的分布进行综合评价,得出一个综合值,这样对一个单词进行属性提取,属性的差异可以直接影响得分,简化了模型的复杂度(其实是复杂的我不会~),属性是否影响选择的还是方差分析,加上一些可视化了。

image-20230223232922210

然后我还利用检验结果显著的属性进行数据预处理,之后作为神经网络的输入值预测得分的分布,发现效果还是可以的,更加细致的工作,还是留在第二天吧,太累了,所以早早就回去Sleeping了。

image-20230223231142404

2-18 Day 2

第二天是早上八点左右到达的,我把第一问的编程工作交给了组内的Matlab大佬,我便接着进行后续问题的探索,第二问我是逐步添加一些单词属性进入神经网络模型,不断地调参,最终确定了一个比较合适的一些列的parameters(但我在利用300+的数据,肯定无法避免过拟合问题)。

image-20230223232101417

这是问题三:image-20230223232942248

第三问的主要思路,我用一个伪代码展示一下:

image-20230223232605705

这个也是综合利用到了问题1.2和2建立的模型。

写出思路后我又继续编程,过程还是花了蛮久的。

当天晚上我对第三题第二小问进行了分析,决定使用PCA,计算得分绘制双标图,发现效果是让我满意的;

image-20230223233042320

这个是使用R绘制的,不得不说ggplot很强大!至于这个图表达了啥意思,学过multi variance stastical analysis 应该都了解。

2-19 Day 3

其实上面那个图的最终结果是我今天上午绘制的。

下午就该写论文了,我给matlab大佬安排了写作的计划。下午我也进行了2,3问的写作,晚上也没有熬夜,11点左右就回来了,很轻松。

2-20 Day 4

最后一天是专程写做了,再不写就来不及了,好在昨天晚上已经开始了,写了好多,我在给Q2,Q3的论文部分写好后,又需要对第四问求解:

image-20230223233632629

对于这一问我不是很着急,因为在EDA时候,我已经发现了一些,但最后发现了一些比较独特的部分,这个发现也比较让我吃惊,但也觉得很合理:Wordle玩家增长大多发生在工作日(除了周四),而在周末玩家会下降,当然还有其他。

最后我还写了Letter,这个是题目要求的,美赛论文都要求最后一篇memo或者letter。Letter我主要解释了我建立的四个模型,并且给出了一些游戏未来改进的小建议。

到这就结束了,大概进行到了21号早上三点,很困了。

Summary

这次美赛虽然很累,但我差不多用上了大部分我自学的一些东西,也觉得用Python进行数据分析比以前更加熟练。

  • 建模竞赛不应该是只掉包更重要的是自己要结合题目进行合理的创新,使其达到更好的效果。
  • 绘制的图像美观性要放在和内容一样的地位上,论文的排版就不用说了,如果用LaTex会很幸福,流程图PPT足以。

还没写完,下次再更

0 评论

'