package com.yihaodian.mandy.keyword.server;
public class EidtDistance {
/*private String target;
public int n;
public void setTarget(String target) {
this.target = target;
this.n = target.length();
}*/
private static int minimum(int a,int b,int c){
int mi;
mi=a;
if(b<mi){
mi=b;
}
if(c<mi){
mi=c;
}
return mi;
}
public static int distance(String s,String t){
int d[][];
int n,m;
int i,j;
char s_i,t_j;
int cost;
n=s.length();
m=t.length();
if(n==0)
return m;
if(m==0)
return n;
d=new int[n+1][m+1];
for(i=0;i<=n;i++)
d[i][0]=i;
for(j=0;j<=m;j++)
d[0][j]=j;
for(i=1;i<=n;i++){
s_i=s.charAt(i-1);
for(j=1;j<=m;j++){
t_j=t.charAt(j-1);
if(s_i==t_j)
cost=0;
else
cost=1;
d[i][j]=minimum(d[i-1][j]+1, d[i][j-1]+1, d[i-1][j-1]+cost);
}
}
return d[n][m];
}
public static double getSimilarity(String target,String other){
int distance = distance(target, other);
int n=Math.max(target.length(), other.length());
return (n-distance)*1.0/n;
}
public static void main(String[] args) {
EidtDistance ed = new EidtDistance();
String str1 = "chenlb.blogjava.net";
String str2 = "chenlb.javaeye.com";
System.out.println("ld=" + ed.distance(str1, str2));
System.out.println("sim=" + ed.getSimilarity(str1, str2));
str1 = "sonyyy";
str2 = "sony";
System.out.println("ld2=" + ed.distance(str1, str2));
System.out.println("sim=" + ed.getSimilarity(str1, str2));
str1 = "leenovo";
str2 = "lenovo";
System.out.println("sim=" + EidtDistance.getSimilarity(str1, str2));
str1 = "adfahjfsd";
str2 = "adidas";
System.out.println("ld=" + ed.distance(str1, str2));
System.out.println("sim=" + ed.getSimilarity(str1, str2));
str1 = "cannon";
str2 = "canon";
System.out.println("sim=" + ed.getSimilarity(str1, str2));
str1 = "sony erricson";
str2 = "sony ericsson";
System.out.println("sim=" + ed.getSimilarity(str1, str2));
str1 = "erricson sony";
str2 = "sony ericsson";
System.out.println("sim=" + ed.getSimilarity(str1, str2));
}
}
分享到:
相关推荐
这是 APTED 算法的 Python 实现,它是计算树编辑距离的最先进的解决方案 ,它取代了 RTED 算法 输入 目前,我们只支持输入树的所谓括号表示法,例如,编码{A{B{X}{Y}{F}}{C}}对应于以下树: A / \ B C /|\ X Y...
将字符串A变换为字符串B 所用的最少字符操作数称为字符串A到B 的编辑距离,记为d(A,B)。试设计一个有效算法,对任给的2 个字符串A和B,计算出它们的编辑距离d(A,B)。 编程任务: 对于给定的字符串A和字符串B,编程...
将字符串A变换为字符串B 所用的最少字符操作数称为字符串A到B 的编辑距离,记为d(A,B)。试设计一个有效算法,对任给的2 个字符串A和B,计算出它们的编辑距离d(A,B)。 编程任务: 对于给定的字符串A和字符串B,编程...
Problem A:编辑距离问题 Description 设A 和B 是2 个字符串。要用最少的字符操作将字符串A 转换为字符串B。这里所说的字符操作包括 (1)删除一个字符; (2)插入一个字符; (3)将一个字符改为另一个字符。 将...
自己做的c++的求编辑距离的程序,求插入,删除,替换这几项字符变换产生的编辑距离。
编辑距离问题-算法导论.pdf
编辑距离算法,即Levenshtein Distance (LD)算法。 这个算法其实是一个动态规划(DP)。levenshtein() 返回两个字符串之间的 Levenshtein 距离。 Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个...
SQL SERVER实现编辑距离(Edit Distance)算法,可进行模糊匹配查询
编辑距离的动态规划实现,C/C++,直接可以使用,设:A字符串为a[0:m-1],B字符串为b[0:n-1]; d[i][j]表示a[0]到a[i]变化为b[0]b[j]的编辑距离; 则有: {█(d[i][j]=d[i-1]d[j-1],a[i]=b[j]@min┬█(0≤i≤m-1,@0≤j...
输入任意两个字符串,计算它们的编辑距离。 编辑距离是指两个字符串之间,由一个转换为另一个所需的最少编辑操作次数。许可的编辑操作包括字符的替换、插入和删除。
编辑距离(EditDistance)定义 编辑距离就是用来计算从原串(s)转换到目标串(t)所需要的最少的插入,删除和替换的数目,在NLP中应用比较广泛,如一些评测方法中就用到了(wer,mWer等),同时也常用来计算你对原...
我的上机实验 编辑距离原代码 根据<算法导论>编的
利用动态规划算法解决编辑距离,在度量空间中有编辑距离这一个概念,通常利用动态规划等算法进行解决
如果是A串的第i个字符和B串的第j个字符 1.在A的第i个字符后插入一个字符B[j],问题转化为计算A[i...lenA]和B[j+1...lenB]的距离 ...d [i-1][j] 、d [i][j-1]、d [i-1][j-1]进行比较,其中最小的就是当前A和B的编辑距离
训练能够准确地衡量当前路径与声学最优路径相似性程度的上下文相关音素串编辑距离模型,在N-Best重打分的过程中将音素串编辑距离加入到路径总得分中。在“863-test”测试集上进行的连续语音识别实验显示汉语字的相对...
设A和B是2个字符串.要用最少的字符操作将字符串A转换为字符...将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离,记为d(A,B).试设计一个有效算法,对任给的2个字符串A和B,计算出他们的编辑距离d(A,B)
动态规划之编辑距离问题
编辑距离用来计算两个字符串的相似度。Oracle中提供了相应的函数,但是在Sql server中没有找到,因此到国外网站上copy来一个网友编写的T-SQL版的编辑距离函数。
这是用JS编写的一个编辑距离算法,可以用来在网页中检测语句相似性!检测两个字符串的相似性!
试验题目:近似字符串匹配问题计算两个字符串s1+ch1, s2+ch2的编辑距离有这样的性质: 1. d(s1,””) = d(“”,s1) = |s1| d(“ch1”,”ch2”) = ch1 == ch2 ? 0 : 1; 2. d(s1+ch1,s2+ch2) = min( d(s1,s2)+ ch1==...