算法分析-白红宇

算法分析

阅读量：4705 次

发布时间：2019-06-10

本文共 3488 字，大约阅读时间需要 11 分钟。

参考链接

http://blog.sina.com.cn/s/blog_6b7c77e00101hq1z.html

最基本的可以先通过观察来猜测算法时间

1.控制输入量N，对输入量N和时间进行预测，自然界大部分都符合次幂法则，或者支持其他数学模型。

举一个代码例子

public static void countThreeZero(int[]a){       int n = a.length;       int count = 0;       for(int x=0;x

上面的代码，其中可以看到，if的执行语句次数为 N（N-1）（N-2）=N^3 /6-N^2/2+N/3，当N比较大的时候，可以近视成N^3 /6 即增长数量级 O（N^3）。

分析程序时间所需步骤如下

1.确定输入模型，定义问题的规模。

2.识别内循环

3.根据内循环的操作决定成本模型

4.对于给定输入，判断操作的执行频率，需要一定的数学分析。

比如二分查找，它的输入模型为大小为N的数组a，内循环是一个while循环所有语句，成本模型是比较操作，比较次数最多为lgN+1.

数量级详解

注意：“O”表示量级 (order)，比如说“二分检索是 O(logn)的”,也就是说它需要“通过logn量级的步骤去检索一个规模为n的数组”记法 O ( f(n) )表示当 n增大时，运行时间至多将以正比于 f(n)的速度增长。

这种渐进估计对算法的理论分析和大致比较是非常有价值的，但在实践中细节也可能造成差异。例如，一个低附加代价的O(n2)算法在n较小的情况下可能比一个高附加代价的 O(nlogn)算法运行得更快。当然，随着n足够大以后，具有较慢上升函数的算法必然工作得更快。

O(1)

Temp=i;i=j;j=temp;

分析：

以上三条单个语句的频度均为1，该程序段的执行时间是一个与问题规模n无关的常数。

算法的时间复杂度为常数阶，记作T(n)=O(1)。

这里的1不是1，只是表示一个常数；

如果算法的执行时间不随着问题规模n的增加而增长，即使算法中有上千条语句，其执行时间也不过是一个较大的常数。此类算法的时间复杂度是O(1)。

O(n²)

2.1. 交换i和j的内容

sum=0；（一次）

for(i=1;i<=n;i++) （n次）

for(j=1;j<=n;j++) （n²次）

sum++；（n²次）

解：T(n)=2*n²+n+1 =O(n²)

2.2.

for (i=1;i<n;i++)（n-1次）

{

y=y+1; //1

for (j=0;j<=(2*n);j++)（2*n+1次）

x++; //2

}

解：语句1的频度是n-1

语句2的频度是(n-1)*(2*n+1)=2*n²-n-1

f(n)=2*n²-n-1+(n-1)=2*n²-2

该程序的时间复杂度T(n)=O(n²).

O(n)

2.3.

a=0;

b=1; //1

for (i=1;i<=n;i++) //2

{

s=a+b;　　　　 //3

b=a;　　　　　 //4

a=s;　　　　　 //5

}

解：语句1的频度：2,

语句2的频度： n,

语句3的频度： n-1,

语句4的频度：n-1,

语句5的频度：n-1,

T(n)=2+n+3(n-1)=4n-1=O(n).

O(log₂ⁿ )

2.4.

i=1; //1

while (i<=n)

i=i*2; //2

解：语句1的频度是1,

设语句2的频度是f(n), 则：2^f(n)<=n; f(n)<=log₂ⁿ

取最大值f(n)= log₂ⁿ,

T(n)=O(log₂ⁿ )

O(n³)

2.5.

for(i=0;i<n;i++)

{

for(j=0;j<i;j++)

{

for(k=0;k<j;k++)

x=x+2;

}

解：当i=m, j=k的时候,内层循环的次数为k当i=m时, j 可以取 0,1,...,m-1 ,所以这里最内循环共进行了0+1+...+m-1=(m-1)m/2次

所以,i从0取到n, 则循环共进行了:

0+(1-1)*1/2+...+(n-1)n/2=n(n+1)(n-1)/6所以时间复杂度为O(n³).

我们还应该区分算法的最坏情况的行为和期望行为。如快速排序的最坏情况运行时间是 O(n²)，但期望时间是 O(nlogn)。通过每次都仔细地选择基准值，我们有可能把平方情况 (即O(n²)情况)的概率减小到几乎等于 0。在实际中，精心实现的快速排序一般都能以 (O(nlogn)时间运行。

下面是一些常用的记法：

访问数组中的元素是常数时间操作，或说O(1)操作。一个算法如果能在每个步骤去掉一半数据元素，如二分检索，通常它就取 O(logn)时间。用strcmp比较两个具有n个字符的串需要O(n)时间。常规的矩阵乘算法是O(n³)，因为算出每个元素都需要将n对元素相乘并加到一起，所有元素的个数是n²。

指数时间算法通常来源于需要求出所有可能结果。例如，n个元素的集合共有2n个子集,所以要求出所有子集的算法将是O(2n)的。指数算法一般说来是太复杂了，除非n的值非常小，因为，在这个问题中增加一个元素就导致运行时间加倍。不幸的是，确实有许多问题 (如著名的“巡回售货员问题” )，到目前为止找到的算法都是指数的。如果我们真的遇到这种情况，通常应该用寻找近似最佳结果的算法替代之。

技巧1：

For(i=1; i<n; i*=2)

{

}

那么这个程序片段的时间复杂度就是：O(log₂ⁿ);

在计算程序时间的时候有上界和下界，即算法最好情况和最差情况，下界需要一定的数学功底来讨论，在经典算法中后面会解释，现在先不考虑。

倍率实验

在设计完一个算法的时候，可以根据分析的程序时间进行倍率测试，看看和预期差多少，如下。

package AlthmeticAnalyze;public class RandomArray {   public static int[] getRandom(int min,int max,int number){       int n = max-min;       int []a = new int [number];       for(int x=0;x

修改其中的RandomArray.getRandom的第三项N值，当输入的N为500时，程序时间大概为15ms，当N为100时大约为110，近似O（n^3）的增长级，因为实际时间考虑很多因素所以测量有时候并不精确。

算法的分析大致为时间复杂度和空间复杂度，空间复杂度的分析首先要明白内存关系。这里学习java内存分配。

byte 1个字节

boolean 1个字节

short 2个字节

char 2个字节

int 4个字节

float 4个字节

long 8个字节

double 8个字节

64位和32位的机器java的内存分配不一样，还可以开启内存压缩这种方法，这里讨论64位无压缩的方法。详情算法分析第四版P126

（分配原则，填充为8的倍数）