4月4日 Plan3 【后缀数组/最长公共前缀LCP】自己的注释
听说后缀数组比后缀树有用,那我就不管了啊......
#include<cstdio>
#include<cstring>
#define maxn 10
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int sa[maxn],r[maxn],n;
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++; //把r复制一遍到x里面,ws[]相当于桶排序的桶
for(i=1;i<m;i++) ws[i]+=ws[i-1];//为了不同的数字排名重复,而后面的一定比前面的大
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i; //从后往前分排名,简直太妙了,**注意m和n的使用
for(j=1,p=1;p<n;j*=2,m=p)
{
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; //按照第二关键字,把末尾为零的都往前移
for(i=0;i<n;i++) wv[i]=x[y[i]];//y[i]存放第i小的第二关键字的位置,x[]存放该位置的第一关键字,wv[i]存放的是第i小的第二关键字的第一关键字
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];//以及前一行,保证排名不重复
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i]; //sa[]是综合一二关键字的排名后从小到大的位置
//这里详细解释一下为什么会是这样:首先wv[t]表示的是按第二关键字第t小的第一关键字,
//ws存的是第一关键字不重复的使用个数,y[t]存的是第t大的第二关键字的位置
//相当于,从后往前给“第i小的第二关键字的第一关键字”分排名= 第二关键字第i小的位置
//而这个位置在i递减的情况下是等级逐渐递增的,i递减,第二关键字满足等级逐渐增加,而第一关键字不使用是不降级的
//多看几遍就能理清思路了。。。
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}
int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
int i,j,k=0;
for(i=1;i<=n;i++) rank[sa[i]]=i;
for(i=0;i<n;height[rank[i++]]=k)
for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
return;
}
int main()
{
scanf("%d",&n);
for(int i=1;i<=n;i++) scanf("%d",&r[i]);
da(r,sa,n+1,128);
calheight(r,sa,n);
}
评论