<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>逛呢，进来看看啊 &#187; 社区违规内容的处理逛呢，进来看看啊</title>
	<atom:link href="http://guangne.com/tag/%e7%a4%be%e5%8c%ba%e8%bf%9d%e8%a7%84%e5%86%85%e5%ae%b9%e7%9a%84%e5%a4%84%e7%90%86/feed/" rel="self" type="application/rss+xml" />
	<link>http://guangne.com</link>
	<description>科技、商业、电影、旅行</description>
	<lastBuildDate>Sun, 15 Mar 2026 15:36:57 +0000</lastBuildDate>
	<language>zh-CN</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=3.9.40</generator>
	<item>
		<title>UGC社区产品系列一：违规内容的处理</title>
		<link>http://guangne.com/2013/05/03/ugcxilie1/</link>
		<comments>http://guangne.com/2013/05/03/ugcxilie1/#comments</comments>
		<pubDate>Fri, 03 May 2013 01:27:08 +0000</pubDate>
		<dc:creator><![CDATA[龙猫]]></dc:creator>
				<category><![CDATA[资料]]></category>
		<category><![CDATA[UGC社区产品]]></category>
		<category><![CDATA[社区违规内容的处理]]></category>

		<guid isPermaLink="false">http://guangne.com/?p=628</guid>
		<description><![CDATA[原文来自Gauin&#8217;s Blog，收藏下来，以当资料。 &#160; 景德镇是一个文明和谐的国度， [&#8230;]]]></description>
				<content:encoded><![CDATA[<p><strong>原文来自<span style="text-decoration: underline;"><span style="color: #0000ff;"><a href="http://www.gauin.com/ugc-shequ-chanpin-weigui-neirong-chuli.html" target="_blank"><span style="color: #0000ff; text-decoration: underline;">Gauin&#8217;s Blog</span></a></span></span><span style="color: #0000ff;"><span style="color: #0000ff;"><span style="color: #000000;">，收藏下来，以当资料。</span></span></span><span style="text-decoration: underline;"><span style="color: #0000ff;"><span style="color: #0000ff; text-decoration: underline;"><br />
</span></span></span></strong></p>
<p>&nbsp;</p>
<p>景德镇是一个文明和谐的国度，而我们时刻要保持互联网环境的干净。但对于UGC社区类产品，内容是用户创造的，平台只能即时发现及时处理。倘若不干不净的信息被网警盯上了，可能不会向你打任何招呼，直接拔掉网线了。</p>
<p>所以，在景德镇干产品，你还得学会一件事：<strong>如何快速高效处理违规信息。</strong></p>
<p>按照内容传播环节，扼杀在摇篮里是最保险的，即提交后自动处理。但总有漏网之鱼还是没法被干掉，那就只能在传播中解决掉。</p>
<div id="attachment_629" style="width: 310px" class="wp-caption aligncenter"><a href="http://guangne.com/wp-content/uploads/2013/05/ugc1.jpg" target="_blank"><img class="size-medium wp-image-629" alt="UGC社区类产品违规内容的处理" src="http://guangne.com/wp-content/uploads/2013/05/ugc1-300x230.jpg" width="300" height="230" data-pinit="registered" /></a><p class="wp-caption-text">UGC社区产品违规内容的处理</p></div>
<p><strong>提交后如何识别并自动处理</strong></p>
<p>如何自动识别和处理，需要搞清楚内容包含的信息载体元素和发布内容的行为模式。</p>
<p>信息载体上，内容可分为文字、图片、音频、视频，其中对文字的处理手段最成熟，即关键词、URL等特殊文本信息过滤，图片、音频、视频，恶意URL链接地址识别。<strong>这个过程时间极短，系统只能通过词库或者二维模型做简单运算</strong>并给出是否发布成功的提示，不能做过多运算。如BBS、CMS都采用此过滤法处理。</p>
<p><strong>传播中如何识别和处理</strong></p>
<p>行为模式上，对用户所处地理位置（IP识别、地域识别）、访问方式（登录行为方式停留时间、是否立即发布后离开）、内容发布行为（发布频率、提交速度如何）、账号资料（昵称、邮箱是否有无规律；是否间隔更换账号登录、账户之间是否同一批次注册等）、社交关系（是否与马甲账号关联、是否有真实社交关系存在、是否参与互动），<strong>通过这些维度建立模型进行用户过滤（是否禁用账号），内容过滤。这个过程需要系统强大的运算，故在发布后进行处理。</strong>比如搜搜问问违规问答发布后几分钟被清理，就是采用的此方法。</p>
<p>对机器无法识别处理的内容，比如一些文字内容中关键词隐喻（正话反说、哑谜等手法）、拆分（如装13）等处理手法，机器没法识别，<strong>可采用用户举报功能。系统通过收集用户反馈，对内容进行协同过滤。</strong>比如新浪微博大多数内容的有举报功能。</p>
<p>但也有特殊情况，内容发布的时候不违法规则，但发布后造成了不良影响被判为违规内容了。这时候通常采用系统管理员立即进行人工清理。如新浪微博李开复事件禁言三天。</p>
<p><strong>对违规内容处理手段</strong></p>
<p>对违规内容，一般采用前台清理后台数据保留的做法，严肃的，数据全部清理。又或者采用仅发布者可见，其他用户不可见。或者内容排序垫底靠后不靠前显示，让违规内容直接淹没掉。</p>
<p>看完你会发现处理违规内容的过程，其实和推荐引擎的工作原理挺相似的。最开始一层过滤需要快速响应，类似推荐引擎的冷启动，第二层、和第三层过滤，就需要采用离线数据模型和在线隐性行为模型（系统对用户交互产生的数据反馈分析）和显性行为模型（其他用户举报的反馈数据分析）结合分析过滤掉。</p>
<p>本文虽然写的有点硬，但还是较好理解。主要分享的是一种思路，处理此类问题的方式。产品同学在具体工作实践中，可以结合自己的产品找出维度建立过滤层级模型使用。</p>
]]></content:encoded>
			<wfw:commentRss>http://guangne.com/2013/05/03/ugcxilie1/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
