你真的懂分数吗?(五)——概率与期望

早点关注我,精彩不错过!

67400a0a58647d48f3e4fd59cac86b96.png

上回我们聊到了分数在赌博概率场景的用法——赔率,说明了这一特殊场景下,是如何使用和理解分数的,相关内容请戳:

你真的懂分数吗?(四)——赌博与赔率

你真的懂分数吗?(三)——带分数到小数到百分数

你真的懂分数吗?(二)——分数模型应用初探

你真的懂分数吗?(一)——分数的数学结构和建模

今天,我们进入本系列最后一篇,来看看在一般的随机变量的概率描述中,分数是怎么建模,如何起作用的。

倒数与概率

倒数本身的定义不足为奇,定义为乘法的逆元,即把整环扩展成交换除环时引入的逆元操作。当分数理解就是1个单位作为整体时,分成n份时候的大小。这个场景倒是常见,比如切一个西瓜,分1个苹果等等,但是现实中,也不那么强调严格的均分,单单为这个场景设计一个概念似乎有些多余。

但是,在交换除环的结构中,倒数正是其加法逆元求解的值,是非常重要的引入除法和分数作为逆运算的基本定义。而在应用中,我们在概率计算的时候,古典概型or几何概型,或者是无条件的最大熵的均匀分布假设下,计算出来单个事件的概率就是1 / n,刚好是n的倒数。而我们对小数的敏感显然不如直接告诉我们n,即平均是n次发生1次,是一个等价于n个古典概型样本中的1个的发生概率。这样理解就直观了,甚至可以联想起来是多大一袋子苹果抽取指定苹果的画面来,或者它刚好也类似于前面说的赌博的机会比的说法,仍然以1为标准分子,虽然这里早就没有等分的分数原始模型的概念了。

另外,对这样的概率求信息的时候,直接就是logn了,非常直观,这直接就变成编码的理想bit数长度了。甚至还有perplexity这样的概念,是2 ^ H(x),直接等价于一个有这么多选项的均匀分布的分布的混乱程度。在语言模型里就等价于均匀词数,其分布更宽,是更好理解的标度。

当然,直接按照百分数的标度来理解概率,或者用小数表达也一样,这都没什么不好。不过以1为分母的表达,倒是反而给了我们概率多大,或者信息论上大约需要多少bit来存储这样的概念上更多的信息,可以互相借鉴使用。

平均值与期望

除了以上和频率概率bool随机变量伯努利分布相关的1以内的量,现在尝试扩展到一般随机变量看看。我们经常用一个叫平均值的统计量来估计一个分布的期望,并且证明了它有很好的估计性质(一致,有效,无偏等)。但我们如果仔细探寻一下分数的原始定义和这里的用法,会发现其实已经产生了微妙的偏差。比如,我说:平均每个心血管病人放了1.5个支架。看起来这句话平平无奇,我要是发出疑问你都觉得我是不是思维能力有问题,这不就是1.5那么多的意思吗,比1个多,比2个少,刚好在中间呗。但这些都是模糊的理解,不妨真的死理性派一下。

因为支架在每个病人上放置的个数是整数,因此,这个实际上是指的把这个随机变量在整数空间,然后估计出来的数学期望而已,不是真的这么多个,也没人实现这个数。而从估计量本身计算公式的角度上来说,n / m是m个人分n个支架的意思,而且并不是均匀分配的,每个整数也分不开,因此这里1.5只是用一个分数来表达这个实际为整数空间内的随机变量的大小概念,而并没有了真正的均匀分配的意思。而我们只是用了分数的计算法则计算了在这个空间上的值,值产生大脑对其大小的感知,进一步来对每个病人身上会有多少支架形成感性判断。看到了吧,已经是感性层面了,虽然这些细节你没想过,但不妨碍根据这个1.5作出判断和决策,这就是数学有时候无用的地方,推导得很开心,不顾现实的艺术罢了。

XX率其实是这种平均值统计量的特例,即bool变量,其均值在0~1之间。比如:应消耗30粒,已消耗28粒,误差率2 / 30。这里也绝不是说每天都平均少吃了2 / 30,也不是1 / 15,毕竟一粒药根本就不会被掰开吃,投篮命中率也是类似的一起,你是投不进半个球的。这里仍然只是用这个数来作为一个数字特征,统计量对参数的估计,来给出一个定量判断值,早就没有分数均匀分配,还能约分等价的意思了。

即使被估计的对象不要求是整数,比如身高的平均值来估计总体身高的期望,这表达的也不是说170.18cm中的170cm每个人先得了,然后18 / 100 = 9 / 50,把1cm分成2mm一份,每人都恰好能分9份的意思。它依旧是用分数的计算方法提供一个这个法则下计算的结果,来提供一种总体大小估计的数值度量,其原始均分的含义,早就烟消云散了。留下的,只剩下标准度量形成数值感知,以及进制小数作为标准分数的近似表达作用了。

结语

好了,以上就是我以数学模型视角来拆解分数这一基础数学概念并联系到实际生产生活中的应用的全部内容了。我们从分数的数学模型定义开始,从最简分数的意义开始,逐步介绍了表示1以上的带分数和以内的百分数的心理模型,还有和进制绑定的小数;然后进入概率统计领域,首先是最基础的赔率和机会比,再是一般意义下的概率和期望。看到其中每一个细节处对分数的使用,都不是理想化而有很多细微的偏差,但正是这些偏斜使得在特定领域上被恰到好处地使用。

不知道你在生活中还看到分数以怎样的模式被使用?欢迎留言告诉我!

希望你看了这些文字,能够偶尔心中一喜,一惊,一震,对啊,原来是这样!

我就心满意足了。

下个系列见!

d83a2dafd0722e16755a116bd284a29a.gif

我们是谁:

MatheMagician,中文“数学魔术师”,原指用数学设计魔术的魔术师和数学家。既取其用数学来变魔术的本义,也取像魔术一样玩数学的意思。文章内容涵盖互联网,计算机,统计,算法,NLP等前沿的数学及应用领域;也包括魔术思想,流程鉴赏等魔术内容;以及结合二者的数学魔术分享,还有一些思辨性的谈天说地的随笔。希望你能和我一起,既能感性思考又保持理性思维,享受人生乐趣。欢迎扫码关注和在文末或公众号留言与我交流!

43a9141b0e243541f88df7e6754b1973.gif

c7caa6059f9db2243ead3e56ec57b9a5.png

aebf5a03c4a87f207aa1ed5e845d1e4e.jpeg

扫描二维码

关注更多精彩

你真的懂分数吗?(四)——赌博与赔率

De Bruijin序列与魔术(四)——De Bruijin序列的拓展结果

这到底是怎么想到的!!!

一道北大强基题背后的故事(七)——特征根公式的来龙去脉

用排列组合来编码通信(七)——《我的5/4张牌的预言》

2a9557950dfd573d72fd8dc394878aaf.gif

点击阅读原文,往期精彩不错过!文章来源地址https://uudwc.com/A/6zakx

原文地址:https://blog.csdn.net/magic2728/article/details/133191395

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请联系站长进行投诉反馈,一经查实,立即删除!

h
上一篇 2023年09月23日 17:19
下一篇 2023年09月23日 17:19