理解最大似然估计与最大后验估计
最大似然估计最大似然估计(Maxiumum Likelihood Esimation, MLE)是频率学派对概率模型的一种参数估计方法。
它要解决的问题是,针对一定数量的独立重采样得到的样本,如何找到模型的参数 $\theta$,使得样本采样结果出现的概率最大。
具体来说,假设我们知道人身高的分布是正态分布,及概率密度函数的形式为:
f\left(x\right)=\frac1{\sqrt{2\pi}\sigma}exp\left(-\frac{\left(x-u\right)^2}{2\sigma^2}\right)其中,人身高的采样是独立同分布的,也就是你的身高不与别人的身高有关,且你们的身高服从同样的分布,即正态分布。
我们通过问卷调查,获得的一定数量人高的样本,然后估计身高分布模型的参数值方差 $\sigma$ 和均值 $\mu$。
似然函数数学上采用似然函数来解释样本已知,而模型参数未知的情况。
似然函数 $f\left(x\left|\theta\right.\right)$ 指样本 $x$ 已知,而模型参数 $\theta$ 未知的函数。
假使模型的参数 $\theta$ ...
理解最小二乘法
何为最小二乘
最小二乘法是十九世纪统计学的主题曲。从许多方面来看, 它之于统计学就相当于十八世纪的微积分之于数学。 ——史蒂芬·史蒂格勒的《The History of Statistics》
最小二乘是一种从一系列测量值中,计算最可能真值的数学方法。
小明真实的体重在探讨何为最小二乘时,先思考这个问题:
小明是一个健身爱好者,对自己的体重要求非常苛刻,因为这涉及到下一步的训练计划与饮食安排。为了能精确测量出自己的体重,他在市场上购买了9个都号称世界最准的体重秤(小明是个土豪)。
我们知道百分百准确的体重秤是不存在的,这种理想秤只存在于商家的口中。
那么,如何根据这9个比较准确的体重秤,测量出小明的真实体重呢?
可能的计算方案假设每个体重秤测出小明的体重值分别为 $y_1,y_2,y_3,…,y_9$,那么可能存在以下几个方案:
取平均值 $\frac{y_1+y_2+y_3+…+y_9}9$
取中位数 $medium({y_1,y_2,y_3,…,y_9})$
取极大值或极小值
取几何平均数
取调和平均数
掷色子
看心情
有很多种方案,到底哪 ...
浅谈区块链与比特币
什么是区块链和比特币?有人说区块链是新一代价值互联网,有人说它是最慢的数据库,有人说区块链是一项类似于蒸汽机一样巨大的发明创新,也有人说区块链是一个巨大的庞氏骗局。到底什么是比特币,为什么它这么火?本篇文章将带你揭示比特币的前世今生。
区块链跟比特币的定义
区块链是一种去中心化的分布式记账本,而比特币是账本中所记录的数字货币的一种实现。
作为区块链的一种实际应用,比特币(Bitcoin)的原型是由中本聪(Satoshi Nakamoto)在2008年11月1日发表的一篇论文中提出的。比特币的真正诞生是在2009年1月3日。到今天为止,比特币的市值已经水涨船高,一枚比特币的价值高达55484.70美元,合362869.94元人民币!
比特币白皮书
比特币白皮书中文版
区块链要解决什么问题?既然区块链是一种去中心化的货币结算体系,那么原来的货币结算体系有什么问题呢?中本聪在论文的原文讲到:中心化的金融机构由于信任问题,不可避免在交易过程中存在仲裁与纠纷,就导致无法实现不可撤销的交易,在撤销过程中会导致额外的支付成本。当然,这只是现有中心化货币体系不可避免的问题,而区块链基于分布式 ...
自己第一篇SCI文章: LSI-LSTM——个体出行目的地预测模型
内容导读个体驾驶目的地预测对于个性化服务推荐、出行导航、交通调度等基于位置的服务具有重要的参考意义。然而,个体出行不仅具有长时间依赖性,而且受到出行空间上下文的影响,使得精准实时的驾驶目的地预测面临较大挑战。目前,长时间依赖关系建模已存在一定的技术手段,但空间因素对出行过程的影响仍然较少被考虑到。事实上,出发地与沿途的城市功能区、路网关键节点均一定程度反映并影响着司机的出行意图。为此,本文提出一种基于注意力机制和长短期记忆(LSTM)的个体驾驶目的地实时预测模型LSI-LSTM。该模型在兼顾个体出行长时间依赖性学习的同时,从轨迹点的位置语义、轨迹点与目的地间的空间关联关系两个维度建模空间上下文。具体来说,使用高德POI和TF-IDF算法建立轨迹语义提取方法t-LSE,以获得轨迹点所在区域的城市功能区类型;基于转向角、速度、已行驶距离三类驾驶状态评价轨迹点的位置重要性,并利用轨迹空间注意力机制t-SAM进一步捕获与潜在目的地有强空间关联的轨迹点。基于上述城市功能区类型和位置重要性,LSI-LSTM对轨迹点的空间上下文进行建模,在不需要外部路网数据的情况下实现细粒度空间出行特征的学习。基于 ...
npm 常用命令集合
对于 npm 的一些常用命令的汇总
博客中添加足迹地图
足迹地图效果展示足迹地图可以展示你过去到访过的地方,以及到访地点的介绍与图片记录,同时不同地标的半径大小表示了访问该地点的频率高低,如下图所示:
其中每个足迹图标都可以点击,点击会弹出左边的介绍栏及对应的介绍文字与图片。图片点击可以放大显示,如下图所示:
足迹地图使用方式克隆足迹地图项目首先,将足迹地图克隆到本地。
1git clone https://github.com/SUNYunZeng/FootprintMap.git
会得到如下所示的目录结构:
1234567891011121314FootprintMap├─ CNAME├─ css│ ├─ index.css│ └─ jquery-jvectormap-2.0.5.css├─ data│ └─ config.json├─ index.html├─ js│ ├─ index.js│ ├─ jquery-1.9.1.min.js│ ├─ jquery-jvectormap-2.0.5.min.js│ └─ jquery-jvectormap-cn-merc-en. ...
再见2020,你好2021!
这里有东西被加密了,需要输入密码查看哦。
卡尔曼滤波与粒子滤波
卡尔曼滤波卡尔曼滤波解决的是如何从多个不确定数据中提取相对精确的数据。
1) 实践前提是这些数据满足高斯分布。
2) 理论前提是一个高斯斑乘以另一个高斯斑可以得到第三个高斯斑,第三个高斯斑即为提取到相对精确的数据范围。
什么是卡尔曼滤波你可以在任何含有不确定因素的动态系统里使用卡尔曼滤波,而且你应该可以通过某种数学建模对系统下一步动向做一个大概的预测。尽管系统总是会受到一些未知的干扰,但是卡尔曼滤波总是可以派上用场来提高系统预估的精确度,这样你就可以更加准确地知道到底发生了什么事情(系统状态是如何转移的)。而且它可以有效利用多个粗糙数据之间的关系,而单独面对这些数据你可能都无从下手。
卡尔曼滤波尤其适合动态系统。它对于内存要求极低(它仅需要保留系统上一个状态的数据,而不是一段跨度很长的历史数据)。并且它运算很快,这使得它非常适合解决实时问题和应用于嵌入式系统。
卡尔曼滤波我们可以做什么?我们举一个玩具的栗子:你开发了一款小型机器人,它可以在树林里自主移动,并且这款机器人需要明确自己的位置以便进行导航。
我们可以通过一组状态变量 来描述机器人的状态,包括位置和速度:
注意这 ...
工作签约小记
这里有东西被加密了,需要输入密码查看哦。
创建博客带给我的思考
这里有东西被加密了,需要输入密码查看哦。