竹子听

4月4日 Plan3 【后缀数组/最长公共前缀LCP】自己的注释

听说后缀数组比后缀树有用,那我就不管了啊......

#include<cstdio>

#include<cstring> 

#define maxn 10

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];

int sa[maxn],r[maxn],n;

int cmp(int *r,int a,int b,int l)

{return r[a]==r[b]&&r[a+l]==r[b+l];}  

void da(int *r,int *sa,int n,int m)

{

    int i,j,p,*x=wa,*y=wb,*t;

    

    for(i=0;i<m;i++) ws[i]=0;

    for(i=0;i<n;i++) ws[x[i]=r[i]]++; //把r复制一遍到x里面,ws[]相当于桶排序的桶 

    for(i=1;i<m;i++) ws[i]+=ws[i-1];//为了不同的数字排名重复,而后面的一定比前面的大 

    for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i; //从后往前分排名,简直太妙了,**注意m和n的使用 

    

    for(j=1,p=1;p<n;j*=2,m=p)

    {

        for(p=0,i=n-j;i<n;i++) y[p++]=i;  

        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;  //按照第二关键字,把末尾为零的都往前移 

        

        for(i=0;i<n;i++) wv[i]=x[y[i]];//y[i]存放第i小的第二关键字的位置,x[]存放该位置的第一关键字,wv[i]存放的是第i小的第二关键字的第一关键字 

        for(i=0;i<m;i++) ws[i]=0;

        for(i=0;i<n;i++) ws[wv[i]]++; 

        for(i=1;i<m;i++) ws[i]+=ws[i-1];//以及前一行,保证排名不重复 

        for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i]; //sa[]是综合一二关键字的排名后从小到大的位置

//这里详细解释一下为什么会是这样:首先wv[t]表示的是按第二关键字第t小的第一关键字,

//ws存的是第一关键字不重复的使用个数,y[t]存的是第t大的第二关键字的位置 

//相当于,从后往前给“第i小的第二关键字的第一关键字”分排名= 第二关键字第i小的位置  

//而这个位置在i递减的情况下是等级逐渐递增的,i递减,第二关键字满足等级逐渐增加,而第一关键字不使用是不降级的

//多看几遍就能理清思路了。。。 

  for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)

        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; 

    }

     return;

}

int rank[maxn],height[maxn];

void calheight(int *r,int *sa,int n)

{

    int i,j,k=0;

    for(i=1;i<=n;i++) rank[sa[i]]=i;  

for(i=0;i<n;height[rank[i++]]=k) 

    for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);  

    return;

}

int main()

{

scanf("%d",&n);

for(int i=1;i<=n;i++) scanf("%d",&r[i]);

da(r,sa,n+1,128);

calheight(r,sa,n);

}



评论