结巴分词的词性标注

记录一下,方便查阅。

结巴分词的词性标注如下:

1.  名词
名词分为以下子类:
n 名词:成语词典/n
nr 人名: 成祖皇帝/nr
ns 地名:如:天池/ns
nt 机构团体名:如:天津经济技术开发区/nt
nz 其它专用名:
ng 名词性语素:
2.          时间词
t 时间词:如:春天/ t
tg 时间词性语素:春 /tg
3.          处所词
s 处所词
4.          方位词
f 方位词
5.          动词
v 动词
vd 副动词
vn 名动词
vshi 动词“是”
vyou 动词“有”
vf 趋向动词
vx 形式动词
vi 不及物动词(内动词)
vl 动词性惯用语
vg 动词性语素
6.          形容词
a 形容词
ad 副形词
an 名形词
ag 形容词性语素
al 形容词性惯用语
7.          区别词
b 区别词
bl 区别词性惯用语
8.          状态词
z 状态词
9.          代词
r 代词
rg 代词性语素
10.     数词
m 数词
mq 数量词
11.     量词
q 量词: 公顷/q
12.     副词
d 副词: 先/d
13.     介词
p 介词:从
14.     连词
c 连词: 之所以
15.    

代码语法高亮插件Highlightjs

Highlightjs是一款js代码高亮功能,就意味着它是在客户端做语法标亮的,这可以减轻服务器压力,而且关键是它支持的语言非常多。本站,支持3种语法高亮插件,一个是markdown的扩展codehilite,第二个是SyntaxHighlighter,第三种就是Highlightjs。 Highlightjs用法简单,可是我发现一个问题,由于它支持的语言很多,所以如果作者会写很多代码,那么就需要很多种语言,它网站提供定制的打包下载,结果全部勾上后发现最后下载下来的js很大: ( 。我觉得它应该像SyntaxHighlighter一样可以自动加载对应的语言的js这样可以减少js下载,提高网站速度。好了废话不多说,看如何使用。

简单使用





把需要的js文件跟css弄进来,然后对高亮的文本用<pre><code></code></pre>块包裹。这就是基本用法。

高级用法

有时候我们需要指定哪个标签做代码渲染,结果可以如下使用。

python嵌套评论实现

评论系统在一个博客中至关重要,是一个最直接的交流媒介。如何实现一个嵌套的评论呢?这里主要讨论嵌套的展示,评论数据提交部分比较简单,就略过。
首先,来看一张表,如下所示,其中我们最关注2个字段,一个是comment_id,另外一个是comment_parent,也就是说靠这两个字段定位父子关系,数据为0可以认为上面没有父节点了,否,则反。

mysql> SELECT comment_id,comment_post_id,comment_author,comment_author_email,comment_date,comment_parent FROM wp_comments WHERE comment_post_ID = 1 AND ( comment_approved = '1' OR ( comment_author = '回复2.2' AND comment_author_email = 'root@root.com' AND comment_approved = '0' ) ) ORDER BY comment_date_gmt;
+------------+-----------------+----------------+----------------------+---------------------+----------------+
| comment_id | comment_post_id | com