世界流行性相关分析:Google Correlate实验室项目,发现相关流行趋势 

相关系数 - No Comments » - Posted on 五月, 31 at 2:58 下午

Google Correlate是Google的一个实验室项目,它可以找到真实世界里流行趋势的搜索序列。比如搜索“Hand cream”(护手霜),可以看到每年这个词汇的搜索热度(蓝色线条),因为是明显的季节性产品,所以每年的冬天都会火一把。

google相关性分析

 

Google同时会列出很多与Hand cream相关的搜索关键字,比如“cracked hands”(手开裂),你可以对比cracked hands(红色线条)和Hand cream在各个时间段上搜索热度的比较。

每一个相关词前面都会有一个相关系数,表示它们之前的相关程度,cracked hands和Hand cream的相关程度为0.94,是很高的相关性。

我们还可以选择图表中(支持拖拉)2010年至2011年进行详细分析:

google相关性分析

更清楚的了解两者的相关程度。

我们也可以点击右上角的,以散点图的形式查看相关性:

google相关性

注意:Google Correlate相关性只是表示两个事物之间的相关性,并不代表因果性,学统计学的人应该不会搞错,没学过统计学的人注意了,相关性不代表因果性。如一个刚刚出生的孩子的身高与一棵树苗的高度,有很强烈的相关性,但完全不存在任何因果性。

比如搜索“Whitening”(美白),人们越来越关注美白。但这个趋势居然跟“homeowners insurance cost”(家庭财产保险成本)非常相似,相关度达到0.9,但我们不能说这两者是相关的,所以这个相关性不是绝对的,还是需要人工判断的。

google相关性分析

 

google相关分析还有一个强大的功能,手工画一条趋势线,看看什么事物符合这样的趋势,我们尝试如下图。

手工画一条趋势线,看看什么东西在2005年很流行,然后就销声匿迹。

google相关性分析

 

得到的结果是爱立信的T237手机,手机的更新换代真的是太快了,这个手机一两年内就销声匿迹了。

google相关分析还有一个地区分析的应用,目前只是基于美国地区,我们还是搜索Hand cream,可以看出irish sweater爱尔兰毛衣与head cream在地区分布上有很大的相似性,当然它们不是同类东西。

 

google correlate真的是一个好工具,欢迎大家有好的应用与大家分享。我猜,google相关分析应该是基于我们平时在google搜索的时候,在页面底部会出现搜索建议的这一功能而提炼出来给我们使用的。最近比较关注google的数据分析方面的应用,尽可能在这里和大家分享。

 


深入分析电子商务网站的流量、订单转化率及应对方法 

数学分析 - No Comments » - Posted on 五月, 31 at 2:41 下午

日常推广需要对流量进行分析。而流量分析中的核心是是分析流量的价值,流量的价值是通过流量的订单转化率来衡量的,本人把在运营一个电子商务网站的流量分析的心得与大家分享,如有不明之处,请与本人联系。email:liangbw@gmail.com QQ56065014。

一、订单转化率的定义

订单转化率,即单位流量(UV或IP,按实际需要使用,以下简称流量)所带来的订单数量,即每一百流量带来的订单数量,如1%,2%等。

订单转化率是衡量电子商务网站的一个非常重要的指标。在团购网站,我们需要知道:

  • 如何统计订单转化率
  • 如何分析订单转化率
  • 如何提高订单转化率

 

二、如何统计订单转化率

简单的统计订单转化率是很简单的,拿每天的订单数量除以每天的流量,即得到每天的订单转化率。但如果需要分渠道(来源、客户或者更多角度)来统计订单转化率,就需要使用专业的工具、复杂的设置来实现此功能。我在美心计团购网上采用google analytics来实现此统计分析功能。下面就把我在一个电子商务网站的实施过程一一与大家分享。

Google analytics是google公司出品的强大的统计分析工作,http://www.google.com/analytics/,本文重点不在于教你如何安装及使用google analytics,关于这方面的内容,你可以google一下。Google analytics的强项不仅在于流量统计,更强大的是它的分析功能。下面我就用它来实现订单转化率分析。

1.放置统计代码

<script type=”text/javascript”>

var _gaq = _gaq || [];
_gaq.push(['_setAccount', 'UA-88888888-8']);
_gaq.push(['_trackPageview']);

(function() {
var ga = document.createElement(‘script’); ga.type = ‘text/javascript’; ga.async = true;
ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’;
var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ga, s);
})();

</script>

 

将上面的UA-88888888-8更改为你自己的统计编号即可。

2.目标设定

修改配置文件设置,添加一个目标,按下图进行设置,其中目标渠道设置是我按我的网站的购买过程的每一个步骤进行设置一个子目标,这样可以实现统计客户购买的过程中的每一步的转化率。目标网址可以自定义,但在添加代码中需要使用(参考下面第3点的代码设置)。

美心计订单转化率

3.网页代码

按我们设置的渠道目标,在相应的网页中加入代码。

  • 第一步:用户点击“购买按钮”,在此处添加下面的代码(红色部分)美心计订单转化率onclick=”pageTracker._trackPageview(‘/buy/step_click.html’);”
  • 第二步:用户进入购物车,点击“确认无误,下订单”,在此处添加下面的代码(红色部分)
    美心计订单转化率 

    onclick=”pageTracker._trackPageview(‘/buy/step_qty.html’);”

     

  • 第三步:用户进入订单确认页,点击“确认订单,付款”,在此处添加下面的代码(红色部分)
    美心计订单转化率 

    onclick=”pageTracker._trackPageview(‘/buy/step_order.html’);”

     

  • 第四步:在用户付款成功后,进入一个付款成功的页面,如果付款未成功是不可能进入的,可以在此页而的<body>里添加下面的代码(红色部分)
    onload=”pageTracker._trackPageview(‘/buy/step_pay.html’);”

 

以上步骤,对应于目标设置图里的红色标记处的内容。如果你网站的购物流程不一样,请同时修改目标设定及网页代码。

完成以上工作,google analytics统计器就会正式工作,等上半天的时间,在google analytics后台中就可以看到订单转化率了。

三、如何分析订单转化率

1.简单分析

在google analytics中,点击“目标”-“转化率”,选择一定的时间段,就可以查看订单转化率。

美心计订单转化率

2.渠道转化率

在google analytics中,点击“目标”-“渠道可视化”,我选择一天的流量进行统计,如下图,是客户在购物的每一个流程的转化情况。

美心计订单转化率

2.多角度分析订单转化率

  • 自定义群体

    点击左边的“我的自定义信息”-“高级群体”,创建新的自定义群,出现下图。

    美心计订单转化率

    按我的分析操作,展开流量来源,把“来源”拉到右边的“维度或指标”,在条件中选择“包含”,值输入“tuan800.com”

    美心计订单转化率

    你也可以添加“或”或“与”条件,来更细化分析,最后命名群体为“tuan800.com”

  • 按群体查看订单转化率

    同样,我们在google analytics中的转化率中,点击右上角的“高级群体:所有访问次数”,按下图进行选择。

    美心计订单转化率

    选择的结果如下图。

    美心计订单转化率

    你可以清楚的知道各个渠道的流量来源的订单转化率,至此,我们实现了各种渠道的订单转化率的分析统计。

    在自定义群体中,还可以按不同的条件细分群体,如地面推广时,你可以推广http://www.statr.cn/?3,这样你可以在自定义群体中添加此类群体,你就可以知道地面推广的访问人数及订单转化率了。

    订单转化率及不同群体的转化率,意义非常重大,它可以指导你的广告投放,实现投入产出最大化。


销售预测方法:同比几何平均增长法 

数学分析, 销售预测 - 4 Comments » - Posted on 三月, 5 at 7:05 下午

            基于今年的增长与去年与前年同比增长相同的前提下,为了更准确的描述这个增长的情况,一般使用前N年同比增长的几何平均数代替。此方法没有不需要用到本年本月(N月数据)所以无需使用两种方法进行预测。

 


 

  • 此方法对于只有一年的数据的新产品,无法进行预测;
  • 对于销售比较稳定的产品非常有效;
  • 对于季节性产品的预测也非常不错。

销售预测方法:环比几何平均增长法 

数学分析, 销售预测 - No Comments » - Posted on 二月, 17 at 10:40 上午

           以往多年的同期与上月(或再上一个月,或前N月平均等)商的几何平均数为同期环比增长系数,再乘以今年的上月(或再上一个月或前N月平均,取决于前面的增长系数如何计算)的销售,就得到本期的本月销售预测数。它是基于本期本月比本期上月的增长和往年的平均增长率一样的前提下进行的。
            

………………………以N月预测值为基数 

………………………以N-1月实际值为基数


 

  • 此方法对于只有一年的数据的新产品,无法进行预测;
  • 此方法对于增长比较平稳的产品预测非常有效;
  • 经济波动大的时候此方法不太适合;
  • 处于成长期或衰退期的产品不太适合;
  • 比较适用于处于成熟期的产品预测;

销售预测方法:线性同比绝对增长法 

数学分析, 销售预测 - 1 Comment » - Posted on 二月, 9 at 5:18 下午

    将近一年没有更新博客了,工作太忙了,没时间整理内容,现在把工作中应用到的一些经验文档整理出来与大家分享,销售预测方法一系列方法将会在近期与大家分享,大约会有10种左右,对销售预测有兴趣的人,或正在做销售预测的人,或正在寻找销售预测方法的人,都将会是一个很好的参考资料。

    线性同比绝对增长法

    以本年与去年同期数据进行对比,基于本月比上月绝对数同增长的前提假设下,得出的同比绝对量增长计算方法。如果去年同期没有销售(即销售数据不足一年),则不能使用此方法进行预测。第一个公式分别为以本月数据预测下月,第二个公式以本月预测下下月。

 

……………………..以N月预测值为基数(N月指本月)
   

……………………..以N-1月实际值为基数(N-月指上月)
  • 是指y年m月的预测销量
  • 此方法不适合只有一年数据的销售预测
  • 此方法适合对销售波动变化不大的产品进行销售预测
  • 经验证,对销售波动变化不大的产品此方法十分有效

时间序列分析之一次指数平滑法 

时间序列分析 - 5 Comments » - Posted on 一月, 16 at 10:26 下午

指数平滑法最早是由C.C Holt于1958年提出的,后来经统计学家深入研究使得指数平滑法非常丰富,应用也相当广泛,一般有简单指数平滑法Holt双参数线性指数平滑法Winter线性和季节性指数平滑法。这里的指数平滑法是指最简单的一次指数平滑。

指数平滑法是一种特殊的加权平均法,对本期观察值和本期预测值赋予不同的权重,求得下一期预测值的方法。

一次指数平滑法公式如下:

指数平滑法 ————————-(1)

指数平滑法 为t+1期的指数平滑趋势预测值;
指数平滑法 为t期的指数平滑趋势预测值;
指数平滑法 为t期实际观察值;
指数平滑法权重系数,也称为指数平滑系数那为什么这个种方法会叫做指数平滑法呢?从这个公式并没有看到指数的出现,那指数从何说起平滑又是什么意思,下面就解析这个问题。

在(1)中,最后一个指数平滑法又可以写成如下

一次指数平滑法 ——————–(2)

于是我们把(2)代入(1)式中,得

一次指数平滑法 ————————-(3)

而t-1期的预测值又可以写成:

一次指数平滑法 ————————(4)

把(4)代入(3)式中,得:

一次指数平滑法 ————-(5)

同样道理,再进行多一次同样的代入运算,得:

一次指数平滑法 ————-(6)

通用公式可以写成如下形式:

一次指数平滑法 ———-(7)

由(7)式我们可以看出,t+1期的预测值跟t期及之前的所有期的实际观察值的n递增,所以这里就是指数平滑法中的“指数”的意义所在

由于的n(整数)按步长1一直递增,而在0到1之间,所以的值会越来越小,从(7)式中看就是说离t+1期越久远的实际观察值,对t+1期的预测值的影响越少。

从(7)式中,还有最后一项,F1就是第一期的预测值,但数据中并没有第一期的预测值,所以一般取前3期的实际观察值来代替,实际上这个F1并不重要,因为是个介于0-1之间的小数,当t很大时,的t次方(乘方)后,已经非常接近0的了,所以F1在(7)式中的作用并不大。

(7)式用文字描述就是,对离预测期较近的观察值赋予较大的权数,对离预测值较远的观察值赋予较小的权数,权数由近到远按指数规律递减,所以叫做指数平滑法

上面说到第一期的F1的值一般取前三期的实际观察值的平均数,这只是一般情况,接下来讨论一下这个F1的取值。

一般分为两种情况,当样本为大样本时(n>42),F1一般以第一期的观察值代替;当样本为小样本时(n<42),F1一般取前几期的平均值代替。

下面举个例子来说明指数平滑法的计算方法,让大家更容易清晰的明白指数平滑法是如何进行的。

某产品过去20个月的销售数据如下(点击下载EXCEL文件exponential_smoothing.zip ):

C列为指数平滑法计算得到的预测值,F1的值为前三期的平均值,即在C2处输入=AVERAGE(B2:B4),C3处输入=$E$1*B2+(1-$E$1)*C2,E1的值是指数平滑系数,C3中引用到E1的值需要有绝对引用,这样把C3处的公式下拉复制到C21时,公式永远都是引用E1的指数平滑系数。

得出来的结果如下图:

可以看到,指数平滑法进行预测,是有滞后作用的,这是指数平滑法的一个缺点。要对21期进行预测,只需在A22处输入21,把公式下拉复制到C22即可。

由此图可见,预测趋势与实际变动趋势一致,但预测值比实际值滞后,如果再算一下均方误差,也会出现比较大的情况,一般通过改变指数平滑系数,找出一个均方误差最小的。

一次指数平滑法优点在于它在计算中将所有的观察值在考虑在内,对各期按时期的远近赋予不同的权重,使预测值更接近实际观察值。

但一次指数平滑法只适合于具有水平发展趋势的时间序列分析,只能对近期进行预测。如果碰到时间序列具有上升或下降趋势时,在这个上升或下降的过程中,预测偏差会比较大,这时最好用二次指数平滑法进行预测,二次指数平滑法将会在以后的文章中介绍。

–>


基于统计学的安全库存的计算 

物流 - 6 Comments » - Posted on 十二月, 27 at 11:34 下午

    安全库存的计算一般需要借助统计学方面的知识,假设顾客的需求服从正态分布,通过设定的显著性水平来估算需求的最大值,从而确定合理的库存

    统计学中的显著性水平显著性水平,在物流计划中叫做缺货率,与物流中的服务水平服务水平订单满足率)是对应的,显著性水平=缺货率=1-服务水平。如统计学上的显著性水平一般取为=0.05,即服务水平为0.95,缺货率为0.05。服务水平就是指对顾客需求情况的满足程度。

    看下面的图就最能解释统计学在物流计划中安全库存的计算原理了。

    从上图可以看出,库存=平均需求+安全库存,平均需求也叫周期库存以前的文章有介绍过。本文只讨论安全库存的计算。安全库存(Safe Stock)用SS来表示,那么有

安全库存

    表示在显著性水平为显著性水平,服务水平为服务水平的情况下所对应的服务水平系数,它是基于统计学中的标准正态分布的原理来计算的,它们之间的关系非常复杂,但一般可以通过正态分布表查得。

阅读全文»


如何解决平均需求在月末偏低的办法 

数学分析, 物流 - No Comments » - Posted on 十二月, 19 at 10:26 下午

    企业一般通过前四周平均D来对下一周销售进行预测,再按公式

物流补货计划

来预测确定补货量。

一般企业都存在月末(下旬)的销售比上旬和中旬大,这样前四周平均销售就会偏小,如果用这偏小的前四周平均销售D来补货就会导致月底产生断货的可能性(概率)变大,所以用前四周平均销售D来预测月底周销售就需要把前四周平均销售放大。那放大的倍数如何确定呢?本文就介绍如何确定这个放大的倍率。

通过衡量大量过去月末一周销售和前四周平均销售进行比较,就是月末周销售除以前四周销售,得到一个系数作为调整系数。如下公式:

前四周平均

    其中W为周销售,W5是月末最后一周销售,W1至W4为前四周销售,理论上这是一个比较好的调整系数的确定方法。

现在的问题在于要通过大量的过去的数据来确定多个r值再求平均以最终确定r,这个过程一般是通过程序来实现。由于月末很多时候并不是一整周,程序很难确定月末的那一周,那处理起来相当麻烦。

转换一个想法,使得计算机容易处理,这里采用本月下旬销售与本月中旬、上旬、上月的下旬(大约是前四周)的数据计算。公式如下:

转换后的前四周平均

阅读全文»


为什么需求波动(标准差)后面要乘以LT+T的开方根 

物流 - 2 Comments » - Posted on 十二月, 12 at 11:40 下午

    物流计划中订货的标准简易计算公式

物流计划

    但为什么sigma 后面还会乘以LT+T的开方根呢?要解释这个,就要用到比较复杂的统计学了。

    首先前提是这里的变动只考虑销售(需求)的变动,不考虑供货的波动,需求的波动=SQRT(LT+T)* sigma。这里的SQRT(LT+T)的完整表述是SQRT[(LT+T)/1]。1代表一个时间单位,它的单位取法依赖根号后面的sigma的时间单位。

    比如,假如周需求的标准偏差sigma(周),那么需求的标准偏差 sigma(月)并不是周需求标准偏差sigma(周)的4.3倍(假设1个月=4.3周)。根据统计学原理sigma (月) =SQRT(4.3/1)* sigma(周)。

    再看需求波动的公式,我们需要的是一个LT+T周期内的波动,但我们现在只有周需求标准差sigma(周)或日需求标准差sigma(日),那LT+T周期的累计需求数据标准差未知(当然我们可以用LT+T周期内的各累计需求计算得出,但过程太繁琐),所以我们采用统计学上的一个推断公式,sigma(LT+T)=SQRT[(LT+T) /1]* sigma(单位时间)。而根号里面的1指一个数据计算的单位时间,根号里面的量纲是“时间/时间”,得出一个无量纲的数值。

再回公式物流计划中,这里的sigma是指单位时间内的需求标准差,然后通过乘以SQRT(LT+T)换算为LT+T周期的需求标准差


物流计划中的平均需求D的确定 

物流 - 1 Comment » - Posted on 十二月, 10 at 11:31 下午

    在物流计划中,需计货量是根据的基于统计学的标准公式来计算的

库存计算

    Z是指服务水平,这是一个人为定义的数,LT是到达时间,T是订货周期,I0是当库存存+在途,这些数都很容易定下来。

    但D和标准差标准差的确定就有点困难了,如果这两个数不能确定下来,那就不能算出订货量。本文就主要解决这两个值的确定。

    首先要明白, D是平均需要,标准差标准差也是和D一样,通过同一列数值计算得出。

    假如按周需求(周销售)来做物流计划,需要解决的是周平均需求D的确定,一般人会把周平均需求D等同于前4周周平均出货量。对于某些产品这个方法是不错的,但并不是所有的产品都能这样处理,但可能某些产品就需要用到前8周或其它前N周的周平均需求来订货,靠经验来确定的前N周的N值就有太多的人为成分在里头。本文将介绍一个依靠数学统计方法来定下前N周的N值。

    思路是,通过大量已经发生了的销售(按周统计)对不同的前N周进行订货模拟,用断货比例是否在我们可以接受的水平和如果断货比例在我们可以接受的水平下,哪一种方法令库存最小,来确定最佳的N值。

阅读全文»