Add Thai stopwords (#669)

* Add Thai stopwords from stopwordsiso

* add "th" to language_dict

* add unit test and test data files for Thai language

* - add pythainlp to requirements.txt
- sort requirements.txt

* Update and sort supported language list

* sort the language list

* update language list in docs/index.rst
This commit is contained in:
bact
2019-03-17 07:53:04 +07:00
committed by Lucas Ou-Yang
parent 1cb6a1b143
commit 4c9cde0749
10 changed files with 866 additions and 71 deletions

View File

@@ -193,39 +193,43 @@ Features
input code full name
ar Arabic
ru Russian
nl Dutch
be Belarusian
bg Bulgarian
da Danish
de German
el Greek
en English
es Spanish
et Estonian
fa Persian
fi Finnish
fr French
he Hebrew
hi Hindi
hr Croatian
hu Hungarian
id Indonesian
it Italian
ja Japanese
ko Korean
lt Lithuanian
mk Macedonian
nb Norwegian (Bokmål)
nl Dutch
no Norwegian
fa Persian
pl Polish
pt Portuguese
sv Swedish
hu Hungarian
fi Finnish
da Danish
zh Chinese
id Indonesian
vi Vietnamese
sw Swahili
tr Turkish
el Greek
uk Ukrainian
bg Bulgarian
hr Croatian
ro Romanian
ru Russian
sl Slovenian
sr Serbian
et Estonian
ja Japanese
be Belarusian
lt Lithuanian
sv Swedish
sw Swahili
th Thai
tr Turkish
uk Ukrainian
vi Vietnamese
zh Chinese
Get it now

View File

@@ -194,39 +194,43 @@ Features
input code full name
ar Arabic
ru Russian
nl Dutch
be Belarusian
bg Bulgarian
da Danish
de German
el Greek
en English
es Spanish
et Estonian
fa Persian
fi Finnish
fr French
he Hebrew
hi Hindi
hr Croatian
hu Hungarian
id Indonesian
it Italian
ja Japanese
ko Korean
lt Lithuanian
mk Macedonian
nb Norwegian (Bokmål)
nl Dutch
no Norwegian
fa Persian
pl Polish
pt Portuguese
sv Swedish
hu Hungarian
fi Finnish
da Danish
zh Chinese
id Indonesian
vi Vietnamese
sw Swahili
tr Turkish
el Greek
uk Ukrainian
bg Bulgarian
hr Croatian
ro Romanian
ru Russian
sl Slovenian
sr Serbian
et Estonian
ja Japanese
be Belarusian
lt Lithuanian
sv Swedish
sw Swahili
th Thai
tr Turkish
uk Ukrainian
vi Vietnamese
zh Chinese
Get it now

View File

@@ -14,7 +14,7 @@ import logging
from .parsers import Parser
from .text import (StopWords, StopWordsArabic, StopWordsChinese,
StopWordsKorean, StopWordsHindi, StopWordsJapanese)
StopWordsKorean, StopWordsHindi, StopWordsJapanese, StopWordsThai)
from .version import __version__
log = logging.getLogger(__name__)
@@ -116,6 +116,8 @@ class Configuration(object):
return StopWordsArabic
elif language == 'ja':
return StopWordsJapanese
elif language == 'th':
return StopWordsThai
return StopWords
@staticmethod

View File

@@ -0,0 +1,115 @@
กล่าว
กว่า
กัน
กับ
การ
ก็
ก่อน
ขณะ
ขอ
ของ
ขึ้น
คง
ครั้ง
ความ
คือ
จะ
จัด
จาก
จึง
ช่วง
ซึ่ง
ดัง
ด้วย
ด้าน
ตั้ง
ตั้งแต่
ตาม
ต่อ
ต่าง
ต่างๆ
ต้อง
ถึง
ถูก
ถ้า
ทั้ง
ทั้งนี้
ทาง
ที่
ที่สุด
ทุก
ทํา
ทําให้
นอกจาก
นัก
นั้น
นี้
น่า
นํา
บาง
ผล
ผ่าน
พบ
พร้อม
มา
มาก
มี
ยัง
รวม
ระหว่าง
รับ
ราย
ร่วม
ลง
วัน
ว่า
สุด
ส่ง
ส่วน
สําหรับ
หนึ่ง
หรือ
หลัง
หลังจาก
หลาย
หาก
อยาก
อยู่
อย่าง
ออก
อะไร
อาจ
อีก
เขา
เข้า
เคย
เฉพาะ
เช่น
เดียว
เดียวกัน
เนื่องจาก
เปิด
เปิดเผย
เป็น
เป็นการ
เพราะ
เพื่อ
เมื่อ
เรา
เริ่ม
เลย
เห็น
เอง
แต่
แบบ
แรก
และ
แล้ว
แห่ง
โดย
ใน
ให้
ได้
ไป
ไม่
ไว้

View File

@@ -195,3 +195,15 @@ class StopWordsJapanese(StopWords):
segmenter = tinysegmenter.TinySegmenter()
tokens = segmenter.tokenize(stripped_input)
return tokens
class StopWordsThai(StopWords):
"""Thai segmentation
"""
def __init__(self, language='th'):
super(StopWordsThai, self).__init__(language='th')
def candidate_words(self, stripped_input):
import pythainlp
tokens = pythainlp.word_tokenize(stripped_input)
return tokens

View File

@@ -347,6 +347,7 @@ def get_available_languages():
two_dig_codes = [f.split('-')[1].split('.')[0] for f in stopword_files]
for d in two_dig_codes:
assert len(d) == 2
two_dig_codes.sort()
return two_dig_codes
@@ -355,42 +356,43 @@ def print_available_languages():
"""
language_dict = {
'ar': 'Arabic',
'ru': 'Russian',
'nl': 'Dutch',
'be': 'Belarusian',
'bg': 'Bulgarian',
'da': 'Danish',
'de': 'German',
'el': 'Greek',
'en': 'English',
'es': 'Spanish',
'et': 'Estonian',
'fa': 'Persian',
'fi': 'Finnish',
'fr': 'French',
'he': 'Hebrew',
'hi': 'Hindi',
'hr': 'Croatian',
'hu': 'Hungarian',
'id': 'Indonesian',
'it': 'Italian',
'ja': 'Japanese',
'ko': 'Korean',
'no': 'Norwegian',
'lt': 'Lithuanian',
'mk': 'Macedonian',
'nb': 'Norwegian (Bokmål)',
'fa': 'Persian',
'nl': 'Dutch',
'no': 'Norwegian',
'pl': 'Polish',
'pt': 'Portuguese',
'sv': 'Swedish',
'hu': 'Hungarian',
'fi': 'Finnish',
'da': 'Danish',
'zh': 'Chinese',
'id': 'Indonesian',
'vi': 'Vietnamese',
'mk': 'Macedonian',
'tr': 'Turkish',
'el': 'Greek',
'uk': 'Ukrainian',
'hi': 'Hindi',
'sw': 'Swahili',
'bg': 'Bulgarian',
'hr': 'Croatian',
'ro': 'Romanian',
'ru': 'Russian',
'sl': 'Slovenian',
'sr': 'Serbian',
'et': 'Estonian',
'ja': 'Japanese',
'be': 'Belarusian',
'lt': 'Lithuanian'
'sv': 'Swedish',
'sw': 'Swahili',
'th': 'Thai',
'tr': 'Turkish',
'uk': 'Ukrainian',
'vi': 'Vietnamese',
'zh': 'Chinese',
}
codes = get_available_languages()

View File

@@ -1,13 +1,14 @@
beautifulsoup4>=4.4.1
Pillow>=3.3.0
PyYAML>=3.11
cssselect>=0.9.2
feedfinder2>=0.0.4
feedparser>=5.2.1
jieba3k>=0.35.1
lxml>=3.6.0
nltk>=3.2.1
requests>=2.10.0
feedparser>=5.2.1
tldextract>=2.0.1
feedfinder2>=0.0.4
jieba3k>=0.35.1
Pillow>=3.3.0
pythainlp>=1.7.2
python-dateutil>=2.5.3
PyYAML>=3.11
requests>=2.10.0
tinysegmenter==0.3 # TODO(codelucas): Investigate making this >=0.3
tldextract>=2.0.1

View File

@@ -0,0 +1,629 @@
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML+RDFa 1.1//EN">
<html lang="th" dir="ltr" version="HTML+RDFa 1.1"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:dc="http://purl.org/dc/terms/"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:og="http://ogp.me/ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:sioc="http://rdfs.org/sioc/ns#"
xmlns:sioct="http://rdfs.org/sioc/types#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#">
<head profile="http://www.w3.org/1999/xhtml/vocab">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta property="fb:app_id" content="132093777729075" />
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, minimum-scale=1, user-scalable=no" />
<meta name="generator" content="Drupal 7 (https://www.drupal.org)" />
<link rel="canonical" href="https://prachatai.com/journal/2019/01/80642" />
<link rel="shortlink" href="https://prachatai.com/node/80642" />
<meta name="twitter:card" content="summary" />
<meta name="twitter:creator" content="@prachatai" />
<meta name="twitter:url" content="https://prachatai.com/journal/2019/01/80642" />
<meta name="twitter:title" content="ผล DNA ยืนยัน ศพลอยแม่น้ำโขงเป็นคนสนิท อ.สุรชัย" />
<link rel="shortcut icon" href="https://prachatai.com/sites/default/files/pct_index.jpg" type="image/jpeg" />
<title>ผล DNA ยืนยัน ศพลอยแม่น้ำโขงเป็นคนสนิท อ.สุรชัย | ประชาไท Prachatai.com</title>
<style type="text/css" media="all">
@import url("https://prachatai.com/modules/system/system.base.css?plo180");
@import url("https://prachatai.com/modules/system/system.menus.css?plo180");
@import url("https://prachatai.com/modules/system/system.messages.css?plo180");
@import url("https://prachatai.com/modules/system/system.theme.css?plo180");
</style>
<style type="text/css" media="all">
@import url("https://prachatai.com/modules/aggregator/aggregator.css?plo180");
@import url("https://prachatai.com/sites/all/modules/calendar/css/calendar_multiday.css?plo180");
@import url("https://prachatai.com/modules/comment/comment.css?plo180");
@import url("https://prachatai.com/sites/all/modules/date/date_api/date.css?plo180");
@import url("https://prachatai.com/sites/all/modules/date/date_popup/themes/datepicker.1.7.css?plo180");
@import url("https://prachatai.com/modules/field/theme/field.css?plo180");
@import url("https://prachatai.com/modules/node/node.css?plo180");
@import url("https://prachatai.com/modules/user/user.css?plo180");
@import url("https://prachatai.com/sites/all/modules/views/css/views.css?plo180");
</style>
<style type="text/css" media="screen">
@import url("https://prachatai.com/sites/all/modules/reading_progress_bar/css/reading_progress_bar.css?plo180");
</style>
<style type="text/css" media="screen">
<!--/*--><![CDATA[/*><!--*/
progress.reading-progress-bar{color:#ff6600;height:5px;background-color:transparent;border:none;}progress.reading-progress-bar::-webkit-progress-value{background-color:#ff6600;}progress.reading-progress-bar::-moz-progress-bar{background-color:#ff6600;}progress.reading-progress-bar::-webkit-progress-bar{background-color:transparent;}
/*]]>*/-->
</style>
<style type="text/css" media="all">
@import url("https://prachatai.com/sites/all/modules/ctools/css/ctools.css?plo180");
@import url("https://prachatai.com/sites/all/modules/print/print_ui/css/print_ui.theme.css?plo180");
@import url("https://prachatai.com/sites/all/modules/responsive_menus/styles/meanMenu/meanmenu.min.css?plo180");
</style>
<style type="text/css" media="all">
@import url("https://prachatai.com/sites/all/themes/omega/alpha/css/alpha-reset.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/alpha/css/alpha-mobile.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/alpha/css/alpha-alpha.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/omega/css/formalize.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/omega/css/omega-text.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/omega/css/omega-branding.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/omega/css/omega-menu.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/omega/css/omega-forms.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/omega/css/omega-visuals.css?plo180");
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/global.css?plo180");
</style>
<!--[if (lt IE 9)&(!IEMobile)]>
<style type="text/css" media="all">
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default.css?plo180");
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default-normal.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/alpha/css/grid/alpha_default/normal/alpha-default-normal-12.css?plo180");
</style>
<![endif]-->
<!--[if gte IE 9]><!-->
<style type="text/css" media="all and (min-width: 740px) and (min-device-width: 740px), (max-device-width: 800px) and (min-width: 740px) and (orientation:landscape)">
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default.css?plo180");
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default-narrow.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/alpha/css/grid/alpha_default/narrow/alpha-default-narrow-12.css?plo180");
</style>
<!--<![endif]-->
<!--[if gte IE 9]><!-->
<style type="text/css" media="all and (min-width: 980px) and (min-device-width: 980px), all and (max-device-width: 1024px) and (min-width: 1024px) and (orientation:landscape)">
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default.css?plo180");
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default-normal.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/alpha/css/grid/alpha_default/normal/alpha-default-normal-12.css?plo180");
</style>
<!--<![endif]-->
<!--[if gte IE 9]><!-->
<style type="text/css" media="all and (min-width: 1220px)">
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default.css?plo180");
@import url("https://prachatai.com/sites/all/themes/prachatai_x/css/prachatai-x-alpha-default-wide.css?plo180");
@import url("https://prachatai.com/sites/all/themes/omega/alpha/css/grid/alpha_default/wide/alpha-default-wide-12.css?plo180");
</style>
<!--<![endif]-->
<script type="text/javascript" src="https://prachatai.com/sites/all/modules/jquery_update/replace/jquery/1.10/jquery.min.js?v=1.10.2"></script>
<script type="text/javascript" src="https://prachatai.com/misc/jquery.once.js?v=1.2"></script>
<script type="text/javascript" src="https://prachatai.com/misc/drupal.js?plo180"></script>
<script type="text/javascript" src="https://prachatai.com/sites/all/modules/responsive_menus/styles/meanMenu/jquery.meanmenu.min.js?plo180"></script>
<script type="text/javascript" src="https://prachatai.com/sites/all/modules/responsive_menus/styles/meanMenu/responsive_menus_mean_menu.js?plo180"></script>
<script type="text/javascript" src="https://prachatai.com/sites/all/themes/omega/omega/js/jquery.formalize.js?plo180"></script>
<script type="text/javascript" src="https://prachatai.com/sites/all/themes/omega/omega/js/omega-mediaqueries.js?plo180"></script>
<script type="text/javascript">
<!--//--><![CDATA[//><!--
jQuery.extend(Drupal.settings, {"basePath":"\/","pathPrefix":"","ajaxPageState":{"theme":"prachatai_x","theme_token":"gm2tGXjfRV-M9MV04mONNcGh6DccoVZL3HpFG-LW27M","js":{"sites\/all\/modules\/reading_progress_bar\/js\/reading_progress_bar.js":1,"sites\/all\/modules\/facebook_comments_block\/js\/facebook_comments_block.js":1,"sites\/all\/modules\/jquery_update\/replace\/jquery\/1.10\/jquery.min.js":1,"misc\/jquery.once.js":1,"misc\/drupal.js":1,"sites\/all\/modules\/responsive_menus\/styles\/meanMenu\/jquery.meanmenu.min.js":1,"sites\/all\/modules\/responsive_menus\/styles\/meanMenu\/responsive_menus_mean_menu.js":1,"sites\/all\/themes\/omega\/omega\/js\/jquery.formalize.js":1,"sites\/all\/themes\/omega\/omega\/js\/omega-mediaqueries.js":1},"css":{"modules\/system\/system.base.css":1,"modules\/system\/system.menus.css":1,"modules\/system\/system.messages.css":1,"modules\/system\/system.theme.css":1,"modules\/aggregator\/aggregator.css":1,"sites\/all\/modules\/calendar\/css\/calendar_multiday.css":1,"modules\/comment\/comment.css":1,"sites\/all\/modules\/date\/date_api\/date.css":1,"sites\/all\/modules\/date\/date_popup\/themes\/datepicker.1.7.css":1,"modules\/field\/theme\/field.css":1,"modules\/node\/node.css":1,"modules\/user\/user.css":1,"sites\/all\/modules\/views\/css\/views.css":1,"sites\/all\/modules\/reading_progress_bar\/css\/reading_progress_bar.css":1,"0":1,"sites\/all\/modules\/ctools\/css\/ctools.css":1,"sites\/all\/modules\/print\/print_ui\/css\/print_ui.theme.css":1,"sites\/all\/modules\/responsive_menus\/styles\/meanMenu\/meanmenu.min.css":1,"sites\/all\/themes\/omega\/alpha\/css\/alpha-reset.css":1,"sites\/all\/themes\/omega\/alpha\/css\/alpha-mobile.css":1,"sites\/all\/themes\/omega\/alpha\/css\/alpha-alpha.css":1,"sites\/all\/themes\/omega\/omega\/css\/formalize.css":1,"sites\/all\/themes\/omega\/omega\/css\/omega-text.css":1,"sites\/all\/themes\/omega\/omega\/css\/omega-branding.css":1,"sites\/all\/themes\/omega\/omega\/css\/omega-menu.css":1,"sites\/all\/themes\/omega\/omega\/css\/omega-forms.css":1,"sites\/all\/themes\/omega\/omega\/css\/omega-visuals.css":1,"sites\/all\/themes\/prachatai_x\/css\/global.css":1,"ie::normal::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default.css":1,"ie::normal::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default-normal.css":1,"ie::normal::sites\/all\/themes\/omega\/alpha\/css\/grid\/alpha_default\/normal\/alpha-default-normal-12.css":1,"narrow::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default.css":1,"narrow::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default-narrow.css":1,"sites\/all\/themes\/omega\/alpha\/css\/grid\/alpha_default\/narrow\/alpha-default-narrow-12.css":1,"normal::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default.css":1,"normal::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default-normal.css":1,"sites\/all\/themes\/omega\/alpha\/css\/grid\/alpha_default\/normal\/alpha-default-normal-12.css":1,"wide::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default.css":1,"wide::sites\/all\/themes\/prachatai_x\/css\/prachatai-x-alpha-default-wide.css":1,"sites\/all\/themes\/omega\/alpha\/css\/grid\/alpha_default\/wide\/alpha-default-wide-12.css":1}},"facebook_comments_block":{"facebook_settings":{"facebook_app_id":"132093777729075","facebook_app_id_script":"\u0026appId=132093777729075","facebook_app_lang":"th_TH"}},"responsive_menus":[{"selectors":"#block-menu-menu-prachatai-2018-top-category","container":"body","trigger_txt":"\u003Cspan \/\u003E\u003Cspan \/\u003E\u003Cspan \/\u003E","close_txt":"X","close_size":"18px","position":"right","media_size":"720","show_children":"1","expand_children":"1","expand_txt":"+","contract_txt":"-","remove_attrs":"1","responsive_menus_style":"mean_menu"}],"omega":{"layouts":{"primary":"normal","order":["narrow","normal","wide"],"queries":{"narrow":"all and (min-width: 740px) and (min-device-width: 740px), (max-device-width: 800px) and (min-width: 740px) and (orientation:landscape)","normal":"all and (min-width: 980px) and (min-device-width: 980px), all and (max-device-width: 1024px) and (min-width: 1024px) and (orientation:landscape)","wide":"all and (min-width: 1220px)"}}}});
//--><!]]>
</script>
<script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>
<script>
(adsbygoogle = window.adsbygoogle || []).push({
google_ad_client: "ca-pub-5302548355457319",
enable_page_level_ads: true
});
</script>
<meta name="google-site-verification" content="13fEN41rdat-FQbr3jHHLNS0JUvpN-AV5r6fBSRcYVE" />
<script>
jQuery(document).ready(function($) {
$(function() {
$(".support-pay").click(function() {
$(this).addClass("move");
});
});
});
</script>
<!--[if lt IE 9]><script src="http://html5shiv.googlecode.com/svn/trunk/html5.js"></script><![endif]-->
</head>
<body class="html not-front not-logged-in page-node page-node- page-node-80642 node-type-report context-journal">
<div id="skip-link">
<a href="#main-content" class="element-invisible element-focusable">Skip to main content</a>
</div>
<div class="page clearfix" id="page">
<header id="section-header" class="section section-header">
<div id="zone-user-wrapper" class="zone-wrapper zone-user-wrapper clearfix">
<div id="zone-user" class="zone zone-user clearfix container-12">
<div class="grid-12 region region-user-first" id="region-user-first">
<div class="region-inner region-user-first-inner">
<div class="block block-block block-1 block-block-1 odd block-without-title" id="block-block-1">
<div class="block-inner clearfix">
<div class="content clearfix">
<div id="website-logo-block">
<h1 id="website-logo"><a href="/node">ประชาไท</a></h1>
</div>
</div>
</div>
</div><div class="block block-block block-20 block-block-20 even block-without-title" id="block-block-20">
<div class="block-inner clearfix">
<div class="content clearfix">
<a class="top-social-link twitter" href="https://twitter.com/prachatai" target="_blank" title="Twitter @prachatai">Twitter: @prachatai</a>
<a class="top-social-link facebook" href="https://www.facebook.com/prachatai" target="_blank" title="Facebook Page: ประชาไท prachatai.com">Facebook Page: ประชาไท prachatai.com</a>
<a class="top-social-link youtube" href="https://www.youtube.com/prachatai" target="_blank" title="YouTube: Prachatai">YouTube: Prachatai</a>
<a class="top-social-link lineat" href="https://line.me/ti/p/%40prachatai" target="_blank" title="LINE ID @prachatai">LINE ID: @prachatai</a>
<a class="top-social-link instagram" href="https://www.instagram.com/prachatai_quote" target="_blank" title="Instagram @prachatai_quote">Instagram @prachatai_quote</a>
<a class="top-social-link feed" href="https://feeds.feedburner.com/prachatai" target="_blank" title="RSS Feed">RSS Feed</a> </div>
</div>
</div> </div>
</div><div class="grid-12 region region-user-second" id="region-user-second">
<div class="region-inner region-user-second-inner">
<div class="block block-block block-14 block-block-14 odd block-without-title" id="block-block-14">
<div class="block-inner clearfix">
<div class="content clearfix">
<style type="text/css">
.adslot_4 { display:block; width:300px; height:150px; }
@media screen and (min-width:740px) { .adslot_4 { display:block; width: 468px; height: 60px; } }
@media screen and (min-width:960px) { .adslot_4 { display:block; width: 728px; height: 90px; } }
@media screen and (min-width:1220px) { .adslot_4 { display:block; width: 970px; height: 250px; } }
.adslot_3 { display:block; width:300px; height: 150px;
margin: 0 auto;
background:url(https://img.pct.fyi/uploads/big/b9a2ead85b882c81c0340644f2dfddf8.gif) no-repeat;
background-size: 100%;
margin-top: 10px;
margin-bottom: 10px; }
@media screen and (min-width:740px) { .adslot_3 { display:block; width: 468px; height: 121px;
background:url(https://img.pct.fyi/uploads/big/132fee90ce2fb35002223d83096b00b4.gif) no-repeat;
background-size: 100%; } }
.adslot_5 { display:block; width:300px; height: 150px;
margin: 0 auto;
background:url(https://c2.staticflickr.com/8/7877/46632874372_35612e4da8_n.jpg) no-repeat;
background-size: 100%;
margin-bottom: 10px; }
@media screen and (min-width:740px) { .adslot_5 { display:block; width: 468px; height: 121px;
background:url(https://c2.staticflickr.com/8/7879/32810675498_d129af65cd_b.jpg) no-repeat;
background-size: 100%; } }
@media screen and (min-width:960px) { .adslot_3, .adslot_5 { display:block; width: 728px; height: 188px; } }
@media screen and (min-width:1220px) { .adslot_3, .adslot_5 { display:block; width: 970px; height: 250px; } }
</style>
<div style="text-align: center;"><a class="adslot_3" href="https://pct.fyi/3j32c" target="_blank"></a></div>
</div>
</div>
</div> </div>
</div> </div>
</div><div id="zone-branding-wrapper" class="zone-wrapper zone-branding-wrapper clearfix">
<div id="zone-branding" class="zone zone-branding clearfix container-12">
<div class="grid-12 region region-branding" id="region-branding">
<div class="region-inner region-branding-inner">
<div class="block block-block block-19 block-block-19 odd block-without-title" id="block-block-19">
<div class="block-inner clearfix">
<div class="content clearfix">
<form action="https://www.google.com/search" method="get" target="_blank">
<input maxlength="255" name="q" size="31" type="text="" placeholder="ค้นหา" id="popoutsearch" />
<input name="sitesearch" type="hidden" value="prachatai.com" />
<input type="submit" value="search" />
</form> </div>
</div>
</div> </div>
</div> </div>
</div><div id="zone-menu-wrapper" class="zone-wrapper zone-menu-wrapper clearfix">
<div id="zone-menu" class="zone zone-menu clearfix container-12">
<div class="grid-12 region region-menu" id="region-menu">
<div class="region-inner region-menu-inner">
<div class="block block-block block-21 block-block-21 odd block-without-title" id="block-block-21">
<div class="block-inner clearfix">
<div class="content clearfix">
<ul id="top-topmenu"><li><a class="topmenu-color-a" href="/" id="topmenu-front" title="หน้าแรก ประชาไท">ประชาไท</a></li>
<li><a class="topmenu-color-b" href="/english" id="topmenu-english" target="_blank" title="English">English</a></li>
<li><a class="topmenu-color-c" href="https://blogazine.pub" id="topmenu-blogazine" target="_blank" title="บล็อกกาซีน">บล็อกกาซีน</a></li>
<li><a class="topmenu-color-c" href="https://www.prachataistore.net" id="topmenu-store" target="_blank" title="ร้านค้า">ร้านค้า</a></li>
<li><a class="topmenu-color-d" href="/page/banner-promotion" id="topmenu-banner" title="โฆษณา">โฆษณา</a></li>
<li><a class="topmenu-color-a" href="/page/member" id="topmenu-member" title="สมาชิกอุปถัมภ์">สมาชิกอุปถัมภ์</a></li>
<li><a class="topmenu-color-b" href="/support" id="topmenu-support" title="สนับสนุน">สนับสนุน</a></li>
<li><a class="topmenu-color-a" href="/activity" id="topmenu-activity" title="ปฏิทินกิจกรรม">ปฏิทินกิจกรรม</a></li>
<li><a class="topmenu-color-b" href="/classifieds" id="topmenu-classifieds" title="Classifieds">Classifieds</a></li>
<li class="last"><a class="topmenu-color-c" href="https://prachataimonitor.com/?ref=link_prachatai" id="topmenu-monitor" target="_blank" title="มอนิเตอร์">มอนิเตอร์</a></li>
</ul> </div>
</div>
</div><div class="block block-menu block-menu-prachatai-2018-top-category block-menu-menu-prachatai-2018-top-category even block-without-title" id="block-menu-menu-prachatai-2018-top-category">
<div class="block-inner clearfix">
<div class="content clearfix">
<ul class="menu"><li class="first leaf"><a href="/%E0%B9%80%E0%B8%A5%E0%B8%B7%E0%B8%AD%E0%B8%81%E0%B8%95%E0%B8%B1%E0%B9%89%E0%B8%8762" title="">#เลือกตั้ง62</a></li>
<li class="leaf"><a href="/politics" title="">การเมือง</a></li>
<li class="leaf"><a href="/economy" title="">เศรษฐกิจ</a></li>
<li class="leaf"><a href="/culture" title="">วัฒนธรรม บันเทิง</a></li>
<li class="leaf"><a href="/foreign" title="">ต่างประเทศ</a></li>
<li class="leaf"><a href="/life" title="">คุณภาพชีวิต</a></li>
<li class="leaf"><a href="/labour" title="">แรงงาน</a></li>
<li class="leaf"><a href="/environment" title="">สิ่งแวดล้อม</a></li>
<li class="leaf"><a href="/security" title="">ความมั่นคง</a></li>
<li class="leaf"><a href="/ict" title="">ไอซีที</a></li>
<li class="leaf"><a href="/human-rights" title="">สิทธิมนุษยชน</a></li>
<li class="last leaf"><a href="/infographic" title="">สาระ+ภาพ</a></li>
</ul> </div>
</div>
</div> </div>
</div>
</div>
</div><div id="zone-header-wrapper" class="zone-wrapper zone-header-wrapper clearfix">
<div id="zone-header" class="zone zone-header clearfix container-12">
<div class="grid-12 region region-header-first" id="region-header-first">
<div class="region-inner region-header-first-inner">
<div class="block block-views block-custom-breadcrumb-block block-views-custom-breadcrumb-block odd block-without-title" id="block-views-custom-breadcrumb-block">
<div class="block-inner clearfix">
<div class="content clearfix">
<div class="view view-custom-breadcrumb view-id-custom_breadcrumb view-display-id-block view-dom-id-6f6c21df3d84ea6710ef0ba35edbe06a">
<div class="view-content">
<div class="views-row views-row-1 views-row-odd views-row-first views-row-last">
<span class="views-field views-field-nothing"> <span class="field-content"><a href="/">ประชาไท</a></span> </span> /
<span class="views-field views-field-field-variety"> <span class="field-content"><a href="/category/%E0%B8%82%E0%B9%88%E0%B8%B2%E0%B8%A7" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">ข่าว</a></span> </span> </div>
</div>
</div> </div>
</div>
</div> </div>
</div> </div>
</div></header>
<section id="section-content" class="section section-content">
<div id="zone-content-wrapper" class="zone-wrapper zone-content-wrapper clearfix">
<div id="zone-content" class="zone zone-content clearfix container-12">
<div class="grid-8 region region-content" id="region-content">
<div class="region-inner region-content-inner">
<a id="main-content"></a>
<h1 class="title" id="page-title">ผล DNA ยืนยัน ศพลอยแม่น้ำโขงเป็นคนสนิท อ.สุรชัย</h1>
<div class="block block-system block-main block-system-main odd block-without-title" id="block-system-main">
<div class="block-inner clearfix">
<div class="content clearfix">
<article about="/journal/2019/01/80642" typeof="sioc:Item foaf:Document" class="node node-report node-promoted node-published node-not-sticky author-sarayut odd clearfix" id="node-report-80642">
<span property="dc:title" content="ผล DNA ยืนยัน ศพลอยแม่น้ำโขงเป็นคนสนิท อ.สุรชัย" class="rdf-meta element-hidden"></span>
<div class="content clearfix">
<!--FRONT--><span class="submitted-by">Submitted on Mon, 2019-01-21 13:49</span><div class="field field-name-body field-type-text-with-summary field-label-hidden"><div class="field-items"><div class="field-item even" property="content:encoded">
<p style="text-align: center;"><img alt="" src="https://farm8.staticflickr.com/7890/46097871864_6f2f471e68_k_d.jpg" style="width: 600px; height: 313px;"></p>
<p>21 ม.ค.2561 เวลาประมาณ 12.00 น. ผู้สื่อข่าวได้รับแจ้งจากนาย ต.(ไม่ประสงค์เปิดเผยชื่อ) บุตรชายของ 'ภูชนะ' คนสนิทของนายสุรชัย แซ่ด่าน ที่หายไปว่า ผลการตรวจ DNA โดยใช้เนื้อเยื่อของศพที่ถูกสังหารด้วยการมัดแขน รัดคอ ทุบจนใบหน้าเละ และท้องถูกผ่ายัดเสาปูนที่ลอยมาติดที่ อ.ธาตุพนม จ.นครพนม นั้น เมื่อตรวจสอบแล้วมีความเกี่ยวพันทางสายเลือดกับนาย ต.จริง </p>
<p>ภูชนะ (นามแฝง) เป็นคนใกล้ชิดของนายสุรชัย ด่านวัฒนานุสรณ์ หรือ สุรชัย แซ่ด่าน นักเคลื่อนไหวทางการเมืองที่ลี้ภัยออกจากประเทศไทยและได้หายตัวไปจากที่พักในประเทศเพื่อนบ้านในช่วงคืนวันที่ 12-13 ธ.ค.2561 พร้อมกันกับสุรชัยและคนสนิทอีกคนหนึ่ง</p>
<p>ปรานี ด่านวัฒนานุสรณ์ ภรรยาของสุรชัยกล่าวว่า ได้ทราบข่าวจากบุตรชายของภูชนะแล้ว แต่ยังไม่ขอพูดอะไร โดยเบื้องต้นได้ทำใจแต่แรกแล้วว่าเหตุการณ์ลักษณะนี้จะต้องเกิดขึ้นสักวันหนึ่ง<div class="ai:noinject inline-ads-box">
<a href="/page/banner-promotion" target="_blank" class="ai:noinject">ลงโฆษณากับประชาไท</a><br class="ai:noinject"><a href="https://pct.fyi/thisable" target="_blank" class="ai:noinject" style="display:block; width:300px; height:200px; text-indent:-5000px; background:url(https://c2.staticflickr.com/2/1819/28889187867_ab8f175087_o.png) no-repeat;">ThisAble.me</a>
</div></p>
<p>ขณะที่ นาย ว. พี่เขยของ 'กาสะลอง' อีกหนึ่งผู้ลี้ภัยที่ได้หายไปพร้อมกับนายสุรชัยกล่าวกับผู้สื่อข่าวว่า หลังจากได้ทราบผลการตรวจสอบ DNA จากลูกชายของภูชนะ ทางญาติของกาสะลองก็ได้ติดต่อไปที่พนักงานสอบสวนเจ้าของคดีและได้คำตอบว่า จะได้ทราบผลการตรวจสอบ DNA ภายในเวลา 2-3 วันนี้</p>
<p>สุรชัย (78 ปี) ภูชนะ (54 ปี) กาสะลอง (47 ปี) เป็นนักเคลื่อนไหวทางการเมือง และเป็นผู้ลี้ภัยจากเหตุการณ์รัฐประหาร 2557 ไปยังประเทศเพื่อนบ้านได้หายออกจากที่พักในประเทศเพื่อนบ้านโดยที่ไม่มีใครสามารถติดต่อได้จนปัจจุบันนับเป็นเวลานาน 1 เดือน กับอีก 10 วัน</p>
<p><strong>เรื่องที่เกี่ยวข้อง</strong><br><a href="https://prachatai.com/journal/2018/12/80211">ลืออุ้ม อ.สุรชัย ผู้ลี้ภัยหายจากที่พัก 12 วันแล้ว</a><br><a href="https://prachatai.com/journal/2018/12/80328">ตร.เร่งหาเบาะแสคดีฆ่ายัดเสาถ่วงน้ำโขง - เมียไม่เชื่อเป็น 'สุรชัย แซ่ด่าน'</a></p>
</div></div></div><div class="field field-name-field-variety field-type-taxonomy-term-reference field-label-hidden"><div class="field-items"><div class="field-item even"><a href="/category/%E0%B8%82%E0%B9%88%E0%B8%B2%E0%B8%A7" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">ข่าว</a></div></div></div><div class="field field-name-field-category field-type-taxonomy-term-reference field-label-hidden"><div class="field-items"><div class="field-item even"><a href="/category/%E0%B8%81%E0%B8%B2%E0%B8%A3%E0%B9%80%E0%B8%A1%E0%B8%B7%E0%B8%AD%E0%B8%87" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">การเมือง</a></div><div class="field-item odd"><a href="/category/%E0%B8%AA%E0%B8%B4%E0%B8%97%E0%B8%98%E0%B8%B4%E0%B8%A1%E0%B8%99%E0%B8%B8%E0%B8%A9%E0%B8%A2%E0%B8%8A%E0%B8%99" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">สิทธิมนุษยชน</a></div></div></div><div class="field field-name-field-tags field-type-taxonomy-term-reference field-label-hidden"><div class="field-items"><div class="field-item even"><a href="/category/%E0%B8%9C%E0%B8%B9%E0%B9%89%E0%B8%A5%E0%B8%B5%E0%B9%89%E0%B8%A0%E0%B8%B1%E0%B8%A2" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">ผู้ลี้ภัย</a></div><div class="field-item odd"><a href="/category/%E0%B8%AD%E0%B8%B8%E0%B9%89%E0%B8%A1%E0%B8%AB%E0%B8%B2%E0%B8%A2" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">อุ้มหาย</a></div><div class="field-item even"><a href="/category/%E0%B8%AA%E0%B8%B8%E0%B8%A3%E0%B8%8A%E0%B8%B1%E0%B8%A2-%E0%B8%94%E0%B9%88%E0%B8%B2%E0%B8%99%E0%B8%A7%E0%B8%B1%E0%B8%92%E0%B8%99%E0%B8%B2%E0%B8%99%E0%B8%B8%E0%B8%AA%E0%B8%A3%E0%B8%93%E0%B9%8C" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">สุรชัย ด่านวัฒนานุสรณ์</a></div><div class="field-item odd"><a href="/category/%E0%B8%81%E0%B8%B2%E0%B8%AA%E0%B8%B0%E0%B8%A5%E0%B8%AD%E0%B8%87" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">กาสะลอง</a></div><div class="field-item even"><a href="/category/%E0%B8%A0%E0%B8%B9%E0%B8%8A%E0%B8%99%E0%B8%B0" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">ภูชนะ</a></div><div class="field-item odd"><a href="/category/%E0%B8%81%E0%B8%B2%E0%B8%A3%E0%B8%97%E0%B8%B3%E0%B9%83%E0%B8%AB%E0%B9%89%E0%B8%AA%E0%B8%B2%E0%B8%9A%E0%B8%AA%E0%B8%B9%E0%B8%8D" typeof="skos:Concept" property="rdfs:label skos:prefLabel" datatype="">การทำให้สาบสูญ</a></div></div></div><!--BACK-->
<div class="support-pay">
<img src="https://c2.staticflickr.com/2/1799/42011955610_e1a5914e8c_o.png" class="support-pay-img ai:noinject" />
<button></button>
<div class="support-pay-text ">
<strong class="ai:noinject">เท่าไรก็ได้</strong> การสนับสนุนจากคุณ คือการร่วมสร้างและรักษาสื่อเสรี ‘ประชาไท’ ... ร่วมสนับสนุนเรา<br class="ai:noinject" />โอนเงิน พร้อมเพย์ PromptPay "มูลนิธิสื่อเพื่อการศึกษาของชุมชน" 0993000060423<br class="ai:noinject" />โอนเงิน PayPal คลิกที่นี่ <a href="https://paypal.me/prachatai/0thb" class="ai:noinject">https://paypal.me/prachatai</a> <strong><a href="/support/donate">(รายงานยอดบริจาคสนับสนุน)</a></strong>
</div>
</div>
<div class="ai:noinject" style="padding: 2em 0; clear:both;">ติดตามประชาไทอัพเดท ได้ที่:<br class="ai:noinject" />เฟซบุ๊ก https://fb.me/prachatai<br class="ai:noinject" />ทวิตเตอร์ https://twitter.com/prachatai<br class="ai:noinject" />LINE ไอดี = @prachatai</div> </div>
<div class="clearfix">
<nav class="links node-links clearfix"><ul class="links inline"><li class="print_html first last"><a href="/print/80642" title="Display a printer-friendly version of this page." class="print-page" onclick="window.open(this.href); return false" rel="nofollow">Printer-friendly version</a></li></ul></nav>
</div>
</article> </div>
</div>
</div><section class="block block-facebook-comments-block block-fb-comments block-facebook-comments-block-fb-comments even" id="block-facebook-comments-block-fb-comments">
<div class="block-inner clearfix">
<h2 class="block-title">แสดงความคิดเห็น</h2>
<div class="content clearfix">
<div id="fb-root"></div>
<div class="fb-comments" href="https://prachatai.com/node/80642" data-href="https://prachatai.com/node/80642" data-width="500" data-numposts="5" data-colorscheme="light" data-order-by="time"></div>
</div>
</div>
</section> </div>
</div><aside class="grid-4 region region-sidebar-second" id="region-sidebar-second">
<div class="region-inner region-sidebar-second-inner">
<div class="block block-block block-27 block-block-27 odd block-without-title" id="block-block-27">
<div class="block-inner clearfix">
<div class="content clearfix">
<style>
.tshirt-2019 {
display: block;
width: 300px;
height: 200px;
text-indent: -5000px;
background: url(https://img.pct.fyi/uploads/big/923ad8e334a77fc47764618b1b34ff66.jpg) no-repeat;
background-size: 100%;
margin: 0.5em auto 1.5em auto;
}
@media screen and (min-width:740px) {
.tshirt-2019 {
width: 220px;
height: 147px;
}
}
@media screen and (min-width:980px) {
.tshirt-2019 {
width: 300px;
height: 200px;
}
}
@media screen and (min-width:1220px) {
.tshirt-2019 {
width: 380px;
height: 253px;
}
}
</style>
<a class="tshirt-2019" href="https://pct.fyi/sjkx9" target="_blank" title="จำหน่ายแล้ว เสื้อโปโล-เสื้อยืด ประชาไท 2019 ราคา 290 - 390 บาท ส่งฟรี ทั่วประเทศ"></a> </div>
</div>
</div><section class="block block-views block-4f2a8689f5d353b7f1768efe2329a5a6 block-views-4f2a8689f5d353b7f1768efe2329a5a6 even" id="block-views-4f2a8689f5d353b7f1768efe2329a5a6">
<div class="block-inner clearfix">
<h2 class="block-title"><a href="/classifieds">ประชาสัมพันธ์ Classifieds</a> &amp; <a href="/activity">ปฏิทินกิจกรรม</a></h2>
<div class="content clearfix">
<div class="view view-sticky-event-classifieds view-id-sticky_event_classifieds view-display-id-block_1 view-dom-id-4a39587537a23f6ef85b728bd3c6e293">
<div class="view-content">
<div class="item-list"> <ul> <li class="views-row views-row-1 views-row-odd views-row-first">
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/classifieds/2018/09/78547?ref=promote_link">(ดาวน์โหลด) สัญญาณความหวาดกลัวอิสลามในสังคมไทย (ฉบับภาษาไทย + English) PATANI FORUM</a></h3> </div></li>
<li class="views-row views-row-2 views-row-even views-row-last">
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/classifieds/2018/05/77199?ref=promote_link">(ดาวน์โหลด) ไอลอว์เผยแพร่หนังสือ เปิดโปงเบื้องหลังยุทธศาสตร์ชาติ 20 ปี ของ คสช.</a></h3> </div></li>
</ul></div> </div>
</div> </div>
</div>
</section><section class="block block-views block-latest-content-block block-views-latest-content-block odd" id="block-views-latest-content-block">
<div class="block-inner clearfix">
<h2 class="block-title">ข่าวรอบวัน</h2>
<div class="content clearfix">
<div class="view view-latest-content view-id-latest_content view-display-id-block view-dom-id-a874d5449d82a7d25155b769e2ad834f">
<div class="view-content">
<div class="views-row views-row-1 views-row-odd views-row-first">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80665?ref=internal_update_picture"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/10year1.jpg?itok=tDbJfJO7" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80665?ref=internal_update_title">10 yearchallenge: 10 ปีประเทศไทยอะไรเปลี่ยนไปบ้าง</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-22 20:44</span> </div> </div>
<div class="views-row views-row-2 views-row-even">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80664?ref=internal_update_picture"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/s_44990518-1024x791.jpg?itok=7dUxCfrz" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80664?ref=internal_update_title">รัฐบาลจีนลดความสำคัญในการปฏิบัติต่อตระกูลชินวัตรช่วงเยือนจีน</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-22 20:23</span> </div> </div>
<div class="views-row views-row-3 views-row-odd">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80663?ref=internal_update_picture"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/img_8961-crop.jpg?itok=IDab8LRy" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80663?ref=internal_update_title">แก้คอร์รัปชันหลังเลือกตั้ง ชูทุกภาคส่วนสร้างระบบการเมืองเศรษฐกิจโปร่งใส-ลดผูกขาด</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-22 19:44</span> </div> </div>
<div class="views-row views-row-4 views-row-even">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80662?ref=internal_update_picture"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/45922853885_abc7736170_b.jpg?itok=NBZ6m6cs" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80662?ref=internal_update_title">&#039;ครอบครัวจินตกรรม&#039; มองชาติไทยผ่านอุปลักษณ์แบบครอบครัว</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-22 19:44</span> </div> </div>
<div class="views-row views-row-5 views-row-odd">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80659?ref=internal_update_picture"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/cats-crop_229.jpg?itok=IQ2B9XRJ" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80659?ref=internal_update_title">กสม. เสนอ 4 ข้อถึงประยุทธ์และประธาน สนช. ปมร่าง กม.ปราบปรามการทรมาน-อุ้มหาย </a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-22 17:00</span> </div> </div>
<div class="views-row views-row-6 views-row-even views-row-last">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80658?ref=internal_update_picture"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/maartin_luuethr_khing.jpg?itok=MzE7y2GR" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80658?ref=internal_update_title">บทความแปล: จดหมายจากคุกเมืองเบอร์มิงแฮม</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-22 16:26</span> </div> </div>
</div>
</div> </div>
</div>
</section><section class="block block-views block-latest-content-block-1 block-views-latest-content-block-1 even" id="block-views-latest-content-block-1">
<div class="block-inner clearfix">
<h2 class="block-title">เรื่องที่เกี่ยวข้อง</h2>
<div class="content clearfix">
<div class="view view-latest-content view-id-latest_content view-display-id-block_1 view-dom-id-0c5bdddf429c4db0787a46c43d0a8576">
<div class="view-content">
<div class="views-row views-row-1 views-row-odd views-row-first">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80657?ref=internal_relate"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/thwngnamokhng.jpg?itok=rTLrlo8w" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80657?ref=internal_relate">ตร.ยืนยันอีกศพถ่วงน้ำโขง DNA ไม่ขัดแย้งลูกชายกาสะลอง คนสนิทสุรชัย</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-22 16:00</span> </div> </div>
<div class="views-row views-row-2 views-row-even">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80642?ref=internal_relate"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/46097871864_6f2f471e68_k.jpg?itok=tIQMIQ2D" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80642?ref=internal_relate">ผล DNA ยืนยัน ศพลอยแม่น้ำโขงเป็นคนสนิท อ.สุรชัย</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-21 13:49</span> </div> </div>
<div class="views-row views-row-3 views-row-odd">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80512?ref=internal_relate"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/20190112_trudeau_rahaf_0.jpg?itok=iuvMSrl-" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80512?ref=internal_relate">จัสติน ทรูโดเผยแคนาดาตอบรับคำขอลี้ภัยของราฮาฟ อัล-คูนูน</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-12 20:36</span> </div> </div>
<div class="views-row views-row-4 views-row-even">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80501?ref=internal_relate"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/health-care.jpg?itok=0R-4c6v8" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80501?ref=internal_relate">นายกเทศมนตรีนิวยอร์กซิตี้ เสนอแผน &#039;สวัสดิการสุขภาพสำหรับทุกคน&#039; ชี้ส่งผลดีต่องบประมาณ</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-12 11:56</span> </div> </div>
<div class="views-row views-row-5 views-row-odd">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80439?ref=internal_relate"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/46640254781_fdb829970f_o_1.jpg?itok=wHoGgFIH" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80439?ref=internal_relate">ไทย-UNHCR นำหญิงซาอุฯ เข้าประเทศ สื่อนอกระบุวีซ่าออสเตรเลียอาจถูกยกเลิก</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-08 14:56</span> </div> </div>
<div class="views-row views-row-6 views-row-even views-row-last">
<div class="views-field views-field-field-cover-picture"> <div class="field-content"><a href="/journal/2019/01/80425?ref=internal_relate"><img typeof="foaf:Image" src="https://prachatai.com/sites/default/files/styles/cover_small/public/cover-picture/46640254781_fdb829970f_o_0.jpg?itok=clcejVvW" width="300" height="150" alt="" /></a></div> </div>
<div class="views-field views-field-title"> <h3 class="field-content"><a href="/journal/2019/01/80425?ref=internal_relate">องค์กรสิทธิ-กฎหมาย แถลงขอไทยไม่ส่งหญิงซาอุฯ กลับ ล่าสุด UNHCR ถึงตัวแล้ว</a></h3> </div>
<div class="views-field views-field-created"> <span class="field-content">2019-01-07 20:04</span> </div> </div>
</div>
</div> </div>
</div>
</section> </div>
</aside> </div>
</div><div id="zone-postscript-wrapper" class="zone-wrapper zone-postscript-wrapper clearfix">
<div id="zone-postscript" class="zone zone-postscript clearfix container-12">
<div class="grid-6 region region-postscript-first" id="region-postscript-first">
<div class="region-inner region-postscript-first-inner">
<div class="block block-block block-10 block-block-10 odd block-without-title" id="block-block-10">
<div class="block-inner clearfix">
<div class="content clearfix">
<p><img alt="" src="https://c1.staticflickr.com/5/4533/38536140181_90867cd984_z.jpg" /></p>
</div>
</div>
</div> </div>
</div><div class="grid-6 region region-postscript-second" id="region-postscript-second">
<div class="region-inner region-postscript-second-inner">
<div class="block block-block block-8 block-block-8 odd block-without-title" id="block-block-8">
<div class="block-inner clearfix">
<div class="content clearfix">
<p><iframe allow="encrypted-media" allowtransparency="true" frameborder="0" height="214" scrolling="no" src="https://www.facebook.com/plugins/page.php?href=https%3A%2F%2Fwww.facebook.com%2FPrachatai%2F&amp;tabs&amp;width=380&amp;height=214&amp;small_header=false&amp;adapt_container_width=true&amp;hide_cover=false&amp;show_facepile=true&amp;appId=189173344464139" style="border:none;overflow:hidden" width="380"></iframe></p><p><a class="twitter-timeline" data-height="400" data-width="380" href="https://twitter.com/prachatai?ref_src=twsrc%5Etfw">Tweets by prachatai</a> </p>
<script async="" src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> </div>
</div>
</div> </div>
</div> </div>
</div></section>
<footer id="section-footer" class="section section-footer">
<div id="zone-footer-wrapper" class="zone-wrapper zone-footer-wrapper clearfix">
<div id="zone-footer" class="zone zone-footer clearfix container-12">
<div class="grid-12 region region-footer-first" id="region-footer-first">
<div class="region-inner region-footer-first-inner">
<div class="block block-block block-17 block-block-17 odd block-without-title" id="block-block-17">
<div class="block-inner clearfix">
<div class="content clearfix">
<div style="padding: 10px 0;"><ul><li><a href="/about">เกี่ยวกับประชาไท</a></li><li><a href="/about#contact">ติดต่อประชาไท</a></li><li><a href="/journal/2012/06/40971">ประมวลจริยธรรม</a></li><li><a href="/page/member">สมัครสมาชิกอุปถัมภ์ ประชาไท</a></li><li><a href="/page/banner-promotion">รายละเอียด พื้นที่โฆษณา</a></li><li><a href="/sitemap">แผนผังเว็บ</a></li></ul></div><div style="padding: 10px 0;">คำประกาศสิทธิ: เนื้อหาในเว็บไซต์ (ยกเว้นบทความ) ถือสิทธิโดย &quot;ประชาไท&quot; แต่สามารถนำไปใช้งานได้ตามเงื่อนไข สัญญาอนุญาต Creative Commons (cc) BY-NC กล่าวคือ ต้องอ้างอิงแหล่งที่มา และไม่ใช้เพื่อการค้า</div><div style="padding: 10px 0;"><ul><li><a href="https://feeds2.feedburner.com/prachatai?format=xml" target="_blank">RSS Feed</a> <a href="https://feeds2.feedburner.com/prachatai?format=xml" target="_blank"><img src="/misc/feed.png" style="vertical-align:baseline;" /></a></li><li><a href="https://twitter.com/prachatai" target="_blank">Twitter: @prachatai</a></li><li><a href="https://www.facebook.com/prachatai" target="_blank">Facebook: ประชาไท Prachatai.com</a></li><li><a href="https://www.youtube.com/prachatai" target="_blank">YouTube Channel: Prachatai</a></li><li><a href="http://line.me/ti/p/%40prachatai" target="_blank">LINE: @prachatai.com</a></li><li><a href="https://www.instagram.com/prachatai_quote" target="_blank">Instagram: @prachatai_quote</a></li></ul></div><div style="padding: 1em 0 2em 0;"><form action="https://feedburner.google.com/fb/a/mailverify" method="post" onsubmit="window.open('https://feedburner.google.com/fb/a/mailverify?uri=prachatai', 'popupwindow', 'scrollbars=yes,width=550,height=520');return true" target="popupwindow">ลงทะเบียนสมัครรับข่าวผ่านอีเมล : <input id="e-newsletter-form" name="email" style="width:140px" type="text" /> <input name="uri" type="hidden" value="prachatai" /><input name="loc" type="hidden" value="en_US" /><input id="e-newsletter-submit" type="submit" value="ลงทะเบียน" /> โดย <img src="https://img.pct.fyi/uploads/big/f80db407708d263494c25a2defcfd8b6.png" style="vertical-align:baseline;" /></form></div>
<link href="https://feeds2.feedburner.com/prachatai" rel="alternate" title="Prachatai News Online RSS Feed" type="application/rss+xml" /> </div>
</div>
</div><div class="block block-block block-3 block-block-3 even block-without-title" id="block-block-3">
<div class="block-inner clearfix">
<div class="content clearfix">
<div style="text-align:center; padding: 10px 0;"><a href="/about">เกี่ยวกับประชาไท</a> | <a href="/about#contact">ติดต่อประชาไท</a> | <a href="/journal/2012/06/40971">ประมวลจริยธรรม</a><br /><a href="/page/member">สมัครสมาชิกอุปถัมภ์ ประชาไท</a> | <a href="/page/banner-promotion">รายละเอียด พื้นที่โฆษณา</a> | <a href="/sitemap">แผนผังเว็บ</a></div>
<div style="text-align:center; padding: 10px 0;">คำประกาศสิทธิ: เนื้อหาในเว็บไซต์ (ยกเว้นบทความ) ถือสิทธิโดย "ประชาไท" แต่สามารถนำไปใช้งานได้ตามเงื่อนไข<br />สัญญาอนุญาต Creative Commons (cc) BY-NC กล่าวคือ ต้องอ้างอิงแหล่งที่มา และไม่ใช้เพื่อการค้า</div>
<div style="text-align:center; padding: 10px 0;"><a href="https://feeds2.feedburner.com/prachatai?format=xml" target="_blank">RSS Feed</a> <a href="https://feeds2.feedburner.com/prachatai?format=xml" target="_blank"><img src="/misc/feed.png" style="vertical-align:baseline;" /></a> | <a href="https://twitter.com/prachatai" target="_blank">Twitter: @prachatai</a> | <a href="https://www.facebook.com/prachatai" target="_blank">Facebook: ประชาไท Prachatai.com</a><br /><a href="https://www.youtube.com/prachatai" target="_blank">YouTube Channel: Prachatai</a> | <a href="http://line.me/ti/p/%40prachatai" target="_blank">LINE: @prachatai.com</a> | <a href="https://www.instagram.com/prachatai_quote" target="_blank">Instagram: @prachatai_quote</a></div>
<div style="width: 55%; margin: 0 auto; padding: 1em 0 2em 0;">
<form action="https://feedburner.google.com/fb/a/mailverify" method="post" onsubmit="window.open('https://feedburner.google.com/fb/a/mailverify?uri=prachatai', 'popupwindow', 'scrollbars=yes,width=550,height=520');return true" target="popupwindow">ลงทะเบียนสมัครรับข่าวผ่านอีเมล : <input id="e-newsletter-form" name="email" style="width:140px" type="text" /><input name="uri" type="hidden" value="prachatai" /><input name="loc" type="hidden" value="en_US" /><input id="e-newsletter-submit" type="submit" value="ลงทะเบียน" /> โดย <img src="https://img.pct.fyi/uploads/big/f80db407708d263494c25a2defcfd8b6.png" style="vertical-align:baseline;" /></form>
</div>
<link href="https://feeds2.feedburner.com/prachatai" rel="alternate" title="Prachatai News Online RSS Feed" type="application/rss+xml" /> </div>
</div>
</div> </div>
</div><div class="grid-12 region region-footer-second" id="region-footer-second">
<div class="region-inner region-footer-second-inner">
<div class="block block-block block-11 block-block-11 odd block-without-title" id="block-block-11">
<div class="block-inner clearfix">
<div class="content clearfix">
<script type="text/javascript" language="javascript1.1" src="//tracker.stats.in.th/tracker.php?sid=2216"></script><noscript><a target="_blank" href="//www.stats.in.th/">www.Stats.in.th</a></noscript><!-- Start of StatCounter Code for Drupal --><script type="text/javascript">
var sc_project=7919616;
var sc_invisible=1;
var sc_security="3b91cd3f";
</script><script type="text/javascript"
src="//www.statcounter.com/counter/counter.js"></script><noscript><div class="statcounter"><a title="drupal
analytics" href="//statcounter.com/drupal/"
target="_blank"><img class="statcounter"
src="//c.statcounter.com/7919616/0/3b91cd3f/1/"
alt="drupal analytics"></a></div></noscript><!-- End of StatCounter Code for Drupal --><!-- Global site tag (gtag.js) - Google Analytics --><script async src="https://www.googletagmanager.com/gtag/js?id=UA-826882-8"></script><script>
window.dataLayer = window.dataLayer || [];
function gtag(){dataLayer.push(arguments);}
gtag('js', new Date());
gtag('config', 'UA-826882-8');
</script> </div>
</div>
</div><div class="block block-block block-7 block-block-7 even block-without-title" id="block-block-7">
<div class="block-inner clearfix">
<div class="content clearfix">
<div class="website-logo-mobile"><a href="/node">คลิกเข้าเว็บ ประชาไท</a></div>
</div>
</div>
</div><div class="block block-block block-12 block-block-12 odd block-without-title" id="block-block-12">
<div class="block-inner clearfix">
<div class="content clearfix">
<script type="text/javascript" src="//platform-api.sharethis.com/js/sharethis.js#property=59950d75ce46330012f5f6b7&amp;product=sticky-share-buttons"></script> </div>
</div>
</div><div class="block block-block block-26 block-block-26 even block-without-title" id="block-block-26">
<div class="block-inner clearfix">
<div class="content clearfix">
<script>
window.fbAsyncInit = function() {
FB.init({
appId : '132093777729075',
xfbml : true,
version : 'v3.2'
});
FB.AppEvents.logPageView();
};
(function(d, s, id){
var js, fjs = d.getElementsByTagName(s)[0];
if (d.getElementById(id)) {return;}
js = d.createElement(s); js.id = id;
js.src = "https://connect.facebook.net/en_US/sdk.js";
fjs.parentNode.insertBefore(js, fjs);
}(document, 'script', 'facebook-jssdk'));
</script>
</div>
</div>
</div> </div>
</div> </div>
</div></footer> </div> <div class="region region-page-bottom" id="region-page-bottom">
<div class="region-inner region-page-bottom-inner">
<progress class="reading-progress-bar" value="0"></progress> </div>
</div><script type="text/javascript" src="https://prachatai.com/sites/all/modules/reading_progress_bar/js/reading_progress_bar.js?plo180"></script>
<script type="text/javascript" src="https://prachatai.com/sites/all/modules/facebook_comments_block/js/facebook_comments_block.js?plo180"></script>
</body>
</html>

15
tests/data/text/thai.txt Normal file
View File

@@ -0,0 +1,15 @@
21 ม.ค.2561 เวลาประมาณ 12.00 น. ผู้สื่อข่าวได้รับแจ้งจากนาย ต.(ไม่ประสงค์เปิดเผยชื่อ) บุตรชายของ 'ภูชนะ' คนสนิทของนายสุรชัย แซ่ด่าน ที่หายไปว่า ผลการตรวจ DNA โดยใช้เนื้อเยื่อของศพที่ถูกสังหารด้วยการมัดแขน รัดคอ ทุบจนใบหน้าเละ และท้องถูกผ่ายัดเสาปูนที่ลอยมาติดที่ อ.ธาตุพนม จ.นครพนม นั้น เมื่อตรวจสอบแล้วมีความเกี่ยวพันทางสายเลือดกับนาย ต.จริง
ภูชนะ (นามแฝง) เป็นคนใกล้ชิดของนายสุรชัย ด่านวัฒนานุสรณ์ หรือ สุรชัย แซ่ด่าน นักเคลื่อนไหวทางการเมืองที่ลี้ภัยออกจากประเทศไทยและได้หายตัวไปจากที่พักในประเทศเพื่อนบ้านในช่วงคืนวันที่ 12-13 ธ.ค.2561 พร้อมกันกับสุรชัยและคนสนิทอีกคนหนึ่ง
ปรานี ด่านวัฒนานุสรณ์ ภรรยาของสุรชัยกล่าวว่า ได้ทราบข่าวจากบุตรชายของภูชนะแล้ว แต่ยังไม่ขอพูดอะไร โดยเบื้องต้นได้ทำใจแต่แรกแล้วว่าเหตุการณ์ลักษณะนี้จะต้องเกิดขึ้นสักวันหนึ่ง
ขณะที่ นาย ว. พี่เขยของ 'กาสะลอง' อีกหนึ่งผู้ลี้ภัยที่ได้หายไปพร้อมกับนายสุรชัยกล่าวกับผู้สื่อข่าวว่า หลังจากได้ทราบผลการตรวจสอบ DNA จากลูกชายของภูชนะ ทางญาติของกาสะลองก็ได้ติดต่อไปที่พนักงานสอบสวนเจ้าของคดีและได้คำตอบว่า จะได้ทราบผลการตรวจสอบ DNA ภายในเวลา 2-3 วันนี้
สุรชัย (78 ปี) ภูชนะ (54 ปี) กาสะลอง (47 ปี) เป็นนักเคลื่อนไหวทางการเมือง และเป็นผู้ลี้ภัยจากเหตุการณ์รัฐประหาร 2557 ไปยังประเทศเพื่อนบ้านได้หายออกจากที่พักในประเทศเพื่อนบ้านโดยที่ไม่มีใครสามารถติดต่อได้จนปัจจุบันนับเป็นเวลานาน 1 เดือน กับอีก 10 วัน
เรื่องที่เกี่ยวข้อง
ลืออุ้ม อ.สุรชัย ผู้ลี้ภัยหายจากที่พัก 12 วันแล้ว
ตร.เร่งหาเบาะแสคดีฆ่ายัดเสาถ่วงน้ำโขง - เมียไม่เชื่อเป็น 'สุรชัย แซ่ด่าน'

11
tests/unit_tests.py vendored
View File

@@ -730,6 +730,17 @@ class MultiLanguageTestCase(unittest.TestCase):
self.assertEqual(text, article.text)
self.assertEqual(text, fulltext(article.html, 'ja'))
@print_test
def test_thai_fulltext_extract(self):
url = 'https://prachatai.com/journal/2019/01/80642'
article = Article(url=url, language='th')
html = mock_resource_with('thai_article', 'html')
article.download(html)
article.parse()
text = mock_resource_with('thai', 'txt')
self.assertEqual(text, article.text)
self.assertEqual(text, fulltext(article.html, 'th'))
class TestNewspaperLanguagesApi(unittest.TestCase):
@print_test