Archive for November, 2005

Stay Hungry. Stay Foolish.

这是Steve Jobs在斯坦福毕业典礼上的演讲中的一句话: http://news-service.stanford.edu/news/2005/june15/jobs-061505.html 想说的是,看到了两个中文版本的翻译,我觉得都不错: 物有所不足,智有所不明 好学若饥、谦卑若愚 这类演讲其实原来也看过不少,比如Carly在北卡的演讲,感想如下: 成功不可复制,自己需要努力。

Dissect Lucene – Lucene中的文档

在包org.apache.lucene.document中,三个类,其中DateField是用来处理日期与字符串转换的工具类,来方便的处理日期类型的Field。 Field就像我们学过的数据库中的字段,简单的说,就是一个名值对。这个域有三种属性,分别是 isStored – 是否被存储 isIndexed – 是否被索引 isTokenized – 是否分词 这些属性的组合又构成了四种不同类型的Field,而且各有用途,用Xerdoc DSearch中举个例子: Keyword(String name, String value) 存储、索引、不分词,用于URI(比如MSN聊天记录的日期域、比如MP3文件的文件全路径等等) UnIndexed(String name, String value) 存储、不索引、不分词,比如文件的全路径 UnStored(String name, String value) 不存储、索引、分词,比如HTML的正文、Word的内容等等,这部分内容是要被索引的,但是由于具体内容通常很大,没有必要再进行存储,可以到时候根据URI再来挖取。所以,这部分只分词、索引,而不存储。 Text(String name, String value) 存储、索引、分词,比如文件的各种属性,比如MP3文件的歌手、专辑等等。 Text(String name, Reader value) 不存储、索引、分词。 Field经常需要进行Name的比较,比如: /** Returns a field with the given name if any exist in this document, or   [...]

重度Google使用者

早晨看了一下Google Search History,发现自己真的是一个Google重度使用者,有点儿可怕。 8月份竟然有6天每天的搜索量超过了20次,而且只有8月28日那个周日没有进行搜索。看起来,Google Search History似乎还可以作为我上网的证明,凡是没有搜索记录的日子,我应该没有上网,呵呵。