<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: I just found Google Bendi</title>
	<atom:link href="http://www.mengyan.org/blog/archives/2005/09/01/62.html/feed" rel="self" type="application/rss+xml" />
	<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html</link>
	<description></description>
	<lastBuildDate>Thu, 25 Feb 2010 23:18:48 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: 无标题 &#187; Blog Archive &#187; Google在华推出100城市本地搜索服务</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-85886</link>
		<dc:creator>无标题 &#187; Blog Archive &#187; Google在华推出100城市本地搜索服务</dc:creator>
		<pubDate>Mon, 21 Jan 2008 10:54:48 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-85886</guid>
		<description>[...] 此消息是由一个名叫孟岩的博客，首先发现的。  [...]</description>
		<content:encoded><![CDATA[<p>[...] 此消息是由一个名叫孟岩的博客，首先发现的。  [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Meng Yan</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-343</link>
		<dc:creator>Meng Yan</dc:creator>
		<pubDate>Mon, 10 Oct 2005 00:06:12 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-343</guid>
		<description>昨天Google的co-founder说：“我们还会在人们花费时间多的事情上（比如Mail、IM...）下文章”</description>
		<content:encoded><![CDATA[<p>昨天Google的co-founder说：“我们还会在人们花费时间多的事情上（比如Mail、IM&#8230;）下文章”</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: 韬略</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-340</link>
		<dc:creator>韬略</dc:creator>
		<pubDate>Sun, 09 Oct 2005 16:01:55 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-340</guid>
		<description>Google仗着自己收集到的庞大的网页(还有邮件), 不停的捉摸如何发觉潜在的商机, 总有一天, 他们会无孔不入. 
另外Google Talk 很有可能会打败任何的IM, 也很有可能会继承GMail, Desktop Search, Google Search, Earth(Maps), RSS等一切的东西,  这帮Google疯子什么事情都做得出来.</description>
		<content:encoded><![CDATA[<p>Google仗着自己收集到的庞大的网页(还有邮件), 不停的捉摸如何发觉潜在的商机, 总有一天, 他们会无孔不入.<br />
另外Google Talk 很有可能会打败任何的IM, 也很有可能会继承GMail, Desktop Search, Google Search, Earth(Maps), RSS等一切的东西,  这帮Google疯子什么事情都做得出来.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Learning is like rowing upstream:</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-117</link>
		<dc:creator>Learning is like rowing upstream:</dc:creator>
		<pubDate>Fri, 02 Sep 2005 17:58:34 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-117</guid>
		<description></description>
		<content:encoded><![CDATA[<p><strong>Google的几个新产品,已经不新了:)</strong></p>
<p>8月22号,google推出了gooogle talk ,第一时间试用了,传说现在关于google talk 的新玩法超级多,需要不断挖掘google talk的潜力啊.<br />
google  推出了destop 2 ,又是很快下载了来用,很是喜欢这个工具,比如说我刚&#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Meng Yan</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-116</link>
		<dc:creator>Meng Yan</dc:creator>
		<pubDate>Fri, 02 Sep 2005 12:53:06 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-116</guid>
		<description>谢谢Jared的解释，的确，中文分词和无官方标准等问题恐怕是Google研究院会开展的项目 :P</description>
		<content:encoded><![CDATA[<p>谢谢Jared的解释，的确，中文分词和无官方标准等问题恐怕是Google研究院会开展的项目 <img src='http://www.mengyan.org/blog/wp-includes/images/smilies/icon_razz.gif' alt=':P' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>By: etarip</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-114</link>
		<dc:creator>etarip</dc:creator>
		<pubDate>Fri, 02 Sep 2005 08:48:43 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-114</guid>
		<description>我们日常使用的地址的格式确实繁多杂乱，并不存在官方地址标准，加上中文分词问题，导致在中国做Address Geocoding的复杂度远高于美国、新加坡等地。</description>
		<content:encoded><![CDATA[<p>我们日常使用的地址的格式确实繁多杂乱，并不存在官方地址标准，加上中文分词问题，导致在中国做Address Geocoding的复杂度远高于美国、新加坡等地。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Jared</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-113</link>
		<dc:creator>Jared</dc:creator>
		<pubDate>Fri, 02 Sep 2005 08:33:42 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-113</guid>
		<description>呵呵，看到好消息了。其他地方还没有看到有人在谈论Google Bendi呢。

使用过Google Bendi后，会发现搜索结果并不是很精确，有的单位找不到，有些单位又指错了位置，这是由于两种原因。

Google Bendi的前身Google Local的原理和很多要通过人手添加资料的电子地图不同，它是通过程序自动分析Google数据库中80亿网页中的单位资料，然后通过单位的地址来匹配该单位在地图上的位置。如果一个单位在某些网站如POCO上有资料，那这个单位在Google Bendi中就可以搜得到，但如果某个单位在Google收录的所有网页中不存在任何资料，那当然在Google Bendi中也就不可能找得到了。

为什么有时会发行Google Bendi的地址定位会不精确呢？这主要是因为中国的地址系统比较混乱。在美国或英国，地址的格式都是非常标准的，如“King&#039;s College, 170 Strand, WC2E 7AA, London”，地址通过逗号一层一层的分开，由小到大排列，很规范，通过这个地址可以很准确的知道King&#039;s College具体位置。但中国的地址呢，这里有几个例子：“江南大道中332号二楼”，“江南西路润汇大厦三层”，“石牌东路139号(06)”。三个地址有三种不同的格式，所以很难通过程序来分析和定位。这就造成了Google Bendi的某些地址定位不精确的问题，而Google也在Bendi的帮助中明确指出了这一点。而且为了处理这些不精确的结果，Google Bendi特别为搜索结果标识了“精确位置”和“估计位置”，分别用红色图标和绿色图标来标识，这在Google Local中是没有的。</description>
		<content:encoded><![CDATA[<p>呵呵，看到好消息了。其他地方还没有看到有人在谈论Google Bendi呢。</p>
<p>使用过Google Bendi后，会发现搜索结果并不是很精确，有的单位找不到，有些单位又指错了位置，这是由于两种原因。</p>
<p>Google Bendi的前身Google Local的原理和很多要通过人手添加资料的电子地图不同，它是通过程序自动分析Google数据库中80亿网页中的单位资料，然后通过单位的地址来匹配该单位在地图上的位置。如果一个单位在某些网站如POCO上有资料，那这个单位在Google Bendi中就可以搜得到，但如果某个单位在Google收录的所有网页中不存在任何资料，那当然在Google Bendi中也就不可能找得到了。</p>
<p>为什么有时会发行Google Bendi的地址定位会不精确呢？这主要是因为中国的地址系统比较混乱。在美国或英国，地址的格式都是非常标准的，如“King&#8217;s College, 170 Strand, WC2E 7AA, London”，地址通过逗号一层一层的分开，由小到大排列，很规范，通过这个地址可以很准确的知道King&#8217;s College具体位置。但中国的地址呢，这里有几个例子：“江南大道中332号二楼”，“江南西路润汇大厦三层”，“石牌东路139号(06)”。三个地址有三种不同的格式，所以很难通过程序来分析和定位。这就造成了Google Bendi的某些地址定位不精确的问题，而Google也在Bendi的帮助中明确指出了这一点。而且为了处理这些不精确的结果，Google Bendi特别为搜索结果标识了“精确位置”和“估计位置”，分别用红色图标和绿色图标来标识，这在Google Local中是没有的。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Meng Yan</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-110</link>
		<dc:creator>Meng Yan</dc:creator>
		<pubDate>Fri, 02 Sep 2005 07:01:29 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-110</guid>
		<description>To etarip

谢谢你的留言，你做的项目不错，很有意思，珍惜哦。

大家共同进步，呵呵。</description>
		<content:encoded><![CDATA[<p>To etarip</p>
<p>谢谢你的留言，你做的项目不错，很有意思，珍惜哦。</p>
<p>大家共同进步，呵呵。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: etarip</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-109</link>
		<dc:creator>etarip</dc:creator>
		<pubDate>Fri, 02 Sep 2005 05:59:34 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-109</guid>
		<description>to Meng Yan &amp; other big brothers：

我是北大遥感与地理信息系统研究所的硕士，我的研究方向就是“地址地理编码（Address Geocoding）”，即解析用户输入的日常用的地址，给予精确定位或候选定位列表。

目前能处理缺少一些地址段的情况，如“北京海淀区颐和园路5号”、“海淀区颐和园路北京大学”、“海淀区北京大学”、“颐和园路5号”、“北京大学”等等都会匹配到相同的位置——北京大学（前提是后台数据库里已有此地址相关信息）。

还有很多不完善的地方，主要是两个方面：一是错别字、同音字、缺字漏字等类型的模糊匹配（目前我在做这些），二是门牌号的插值（例如数据库里已有5号、9号、17号，需要定位13号，若仅是线性位置插值也可以解决，但实际情况远复杂的多，这个方面还没深入做）。


我是在CNBlog上看到了&lt;a href=&quot;http://blog.cnblog.org/archives/2005/07/luceneaecee.html&quot; rel=&quot;nofollow&quot;&gt;Lucene使用者沙龙&lt;/a&gt;，于是有幸认识了Xerdoc，认识了Meng Yan。

希望各位Big Brother多指教，小弟先行谢过啦 :)</description>
		<content:encoded><![CDATA[<p>to Meng Yan &amp; other big brothers：</p>
<p>我是北大遥感与地理信息系统研究所的硕士，我的研究方向就是“地址地理编码（Address Geocoding）”，即解析用户输入的日常用的地址，给予精确定位或候选定位列表。</p>
<p>目前能处理缺少一些地址段的情况，如“北京海淀区颐和园路5号”、“海淀区颐和园路北京大学”、“海淀区北京大学”、“颐和园路5号”、“北京大学”等等都会匹配到相同的位置——北京大学（前提是后台数据库里已有此地址相关信息）。</p>
<p>还有很多不完善的地方，主要是两个方面：一是错别字、同音字、缺字漏字等类型的模糊匹配（目前我在做这些），二是门牌号的插值（例如数据库里已有5号、9号、17号，需要定位13号，若仅是线性位置插值也可以解决，但实际情况远复杂的多，这个方面还没深入做）。</p>
<p>我是在CNBlog上看到了<a href="http://blog.cnblog.org/archives/2005/07/luceneaecee.html" rel="nofollow">Lucene使用者沙龙</a>，于是有幸认识了Xerdoc，认识了Meng Yan。</p>
<p>希望各位Big Brother多指教，小弟先行谢过啦 <img src='http://www.mengyan.org/blog/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>By: SongZhen's Weblog</title>
		<link>http://www.mengyan.org/blog/archives/2005/09/01/62.html/comment-page-1#comment-108</link>
		<dc:creator>SongZhen's Weblog</dc:creator>
		<pubDate>Fri, 02 Sep 2005 02:36:46 +0000</pubDate>
		<guid isPermaLink="false">http://www.mengyan.org/blog/archives/2005/09/01/62.html#comment-108</guid>
		<description>&lt;strong&gt;Google Bendi(&#26412;&#22320;)&#25628;&#32034;&lt;/strong&gt;

update&#65306;&#25105;&#35797;&#29992;&#20102;&#19968;&#19979;&#65292;&#22312;&#25152;&#26377;&#22320;&#21517;&#37324;&#26368;&#22909;&#21152;&#19978;&#21271;&#20140;xxx&#21306;</description>
		<content:encoded><![CDATA[<p><strong>Google Bendi(&#26412;&#22320;)&#25628;&#32034;</strong></p>
<p>update&#65306;&#25105;&#35797;&#29992;&#20102;&#19968;&#19979;&#65292;&#22312;&#25152;&#26377;&#22320;&#21517;&#37324;&#26368;&#22909;&#21152;&#19978;&#21271;&#20140;xxx&#21306;</p>
]]></content:encoded>
	</item>
</channel>
</rss>
