ว่ากันด้วยเรื่อง “ตัดคำไทย”

ลองศึกษาจาก 2 ประโยคนี้ดูนะครับ
1. “Dog not eat”
2. “หมาไม่แดก”
เห็นความแตกต่างไหมครับ…

เดี๋ยวพรุ่งนี้จะมาเฉลย… .. .
.
.
.
เปลี่ยนใจเอาวันนี้เลยดีกว่า
ประโยค 2 ประโยคต่างกันเพราะ…
1.เขียนไม่เหมือนกัน
2.อ่านไม่เหมือนกัน
3.ภาษาไม่เหมือนกัน

2714. เว้นวรรคไม่เหมือนกัน

ถะ..ๆๆ.ๆๆๆๆ.ๆๆๆ

พอ… ตูเลิกเล่นแล้ว

คำตอบคือประโยคต่างกัน เพราะไอ้ฝรั่งมันเขียนคำนึง เว้นวรรคทีนึง ส่วนของไทยเขียนไม่เว้นวรรค นอกจากโดนปฏิวัติ เอ้ย… จบประโยค

นี่จึงเ้ป็นที่มาของความอุบาทว์ในการแสดงผลในบางเว็บไซต์ ถ้ายังนึกภาพไม่ออก ลองอ่านต่อไปสิครับ ผมจะพูดถึงเรื่องปัญหาของการตัดคำไทย เกิดขึ้นได้อย่างไร จนไปถึงแนวทางแก้ปัญหา

เรื่องมันเป็นอย่างนี้ครับ คือพอดีนายแด็ก (ชื่อจริง นายแดก นามสถุล ไม่เลือกที่) เขาทำเว็บส่วนตัวห่วยๆขึ้นมาเว็บนึง ก็ใส่ข้อความปัญญาอ่อนลงไป แล้วข้างๆก็ทำเป็นพื้นที่โฆษณาเดือนละ 500 (ถุ้ยยย)
โดยภาพต่อไปนี้จะเป็นภาพจำลองของเว็บนายแด็กนะครับ
- สีดำ คือกรอบแสดงผลเว็บใน Firefox
- สีฟ้า คือส่วนเนื้อหาปัญญาอ่อนของนายแด็ก
- สีส้ม สีเขียว : ตัวประกอบ

วันแีรกนายแด็กชอบกินเฉาก๊วย ก็เลยใส่เนื้อหาว่า

01.png

ไม่มีปัญหาในการแสดงผลครับ เพราะทุกๆคำในเว็บมันลงตัวพอดีเด๊ะ

พอวันที่สอง นายแด็กเจือกชอบกินเฉาก๊วยชุบแป้งทอด

02.png

ฉิบหายแล้วครับ เพราะเนื้อหาคำว่า “ชุบแป้งทอด” ที่เพิ่มเข้ามาทำให้เละ เนื่องจากประโยค “ผมชอบกินเฉาก๊วยชุบแป้งทอดครับ” มันยาวเกินไป ทำให้ไปล้นกับกรอบ layout พาลให้เว็บเละซะฉิบ…

แล้วทีนี้ก็เกิดคำถามครับ ว่าทำไม firefox ถึงเป็น ในขณะที่ ie ไม่เป็น…… คำตอบแบบกำปั้นทุบดิน.. “ก็ ie มันรองรับไงเล่า”

เอาล่ะครับ ที่นี้ก็รู้สาเหตุแล้วว่าสาเหตุเกิดจากอะไร สำหรับแนวทางแก้ปัญญา

สำหรับเว็บมาสเตอร์ :
1.หัดเว้นวรรคให้มากๆเข้าไว้ เพราะท่านคงจะรู้แล้วนะ ว่าการไม่เว้นวรรคแล้วบ้านเมืองจะเป็นยังไง
2.ใช้ script ตัดคำไทยของคุณ ‘bact
2.ทำเว็บให้โปร่งๆเ้ข้าไว้ ดูแล้วมันไม่อึดอัดดีด้วย

สำหรับผู้ใช้ Firefox ทั่วไป (เลือกอย่างใดอย่างหนึ่ง) :
1.ใช้ Firefox รุ่นตัดทำไทย
2.ใช้ Extension ตัดคำไทย

เออ ข้อสองนี่น่าสนใจ แต่เอาข้อแรกก่อน
ในเรื่องของ firefox รุ่นตัดคำไทยนี่หลายท่านก็คงจะรู้แล้วนะครับ มีคนทำหลายคนอยู่ล่ะ แต่ดั้งเดิมเนี่ยะมีอยู่ 2 เจ้า เอาเป็นว่าเคยเขียนไปแล้ว อ่านที่นี่แล้วกัน

แต่การที่จะได้ใช้ Firefox รุ่นตัดคำไทย โดยจะต้องรอให้ลุงแก่ๆ …ที่ไหนเล่า นั่ง build firefox แต่ละเวอร์ชั่น แล้วค่อยเอามาแจกให้คนโหลดก็นานโขทีเดียวเชียวล่ะ ก็เพราะอะไรหรอครับ ก็เพราะ…
1. Build ทีนึงมันก็กินเวลานานค่อนชั่วโมง
2. Firefox มันออกถี่เหลือเกิน บางเดือนออกที 2-3 เวอร์ชั่น ออกบ่อยจนเอือม
3. คน build มีภาระที่ไม่สามารถจะทำได้ เช่น มีธุระ ติดงาน ขี้เกียจ เป็นต้น

เอาล่ะครับ นี่เลยเป็นประเด็นที่ว่า “ไหนๆก็ไหนๆ ทำไมไม่ทำ extension ตัดคำไทยแบบถาวรไปเลยล่ะ เราจะได้ไม่ต้องมานั่ง build ทีละเวอร์ชั่นให้เมื่อยตุ้ม”
ซึ่งใช่ว่าจะไม่มีนะครับ ความจริงน่ะมีแล้ว โดย extension มีชื่อว่า Thai Words Separator (คลิกเพื่อเข้าไปติดตั้งได้เลย) สร้างขึ้นโดยคุณ vavar แล้วโมดิควายมาจาก ThaiWrap bookmarklet ของคุณ bact’

ย้อนกลับเข้าไปถึงเรื่องไอ้แด็กอีกรอบ คราวนี้เมื่อเราใช้การตัดคำไทยแล้ว มันก็จะตัดคำที่ผ่านการพิจารณาแล้วว่าสมควรตัด แต่ยังไง๊ยังไง ก็รับรองเว็บไม่มีทางเละแน่นอน

03.png

แต่ไอ้นั้นมันของจำลอง คราวนี้เรามาดูของจริง ที่ผมทดสอบดีกว่า

ตัวแปรต้น : การใช้/ไม่ใช้ Extension ตัดคำืไทย
ตัวแปรตาม : เว็บจะเละหรือไม่
ตัวแปรควบคุม :
1. Firefox รุ่น 2.0
2. เน็ต 256
3. แรม 512
4. ล้าง cache ก่อนทดสอบ

ในครั้งแรก ผมยังไม่ได้ติดตั้ง extension ตัดคำนะครับ แล้วก็ลองทดสอบกับเว็บผู้จัดการดูก่อน
(ลองดูซิ… เว็บที่พยายามจะให้ใครบางคน “เว้นวรรค” จะเป็นยังไงบ้าง) ผลคือ….

13.png

1. ใช้เวลาไป 19 วินาที ในการเปิดเว็บจนสิ้นสุดมิเตอร์ (ล้าง cache แล้ว)
2. เว็บโคตรเละเลยครับ (ดูตรงส่วนที่ผมไฮไลต์ลูกศรสีส้ม จะเห็นว่าบรรทัดนี้เขาไม่เว้นวรรคเลย ทั้งๆที่พอจะเว้นวรรคตรงส่วนสีเขียวที่ผมมาร์คเอาไว้ได้)

เอาล่ะ… ขั้นต่อมาผมลองติดตั้ง Thai Words Separator เข้าไป ปรากฏว่าผลก็คือ…!!!

22.png

1. ใช้เวลาไป 28 วินาที (หลังจากวินาทีที่ 20 ไป Firefox มีอาการกระตุก)
2. เว็บยังเละอยู่ (จริงอยู่ ที่การตัดคำถูกทำให้ดีขึ้น (ตรงส่วนสีส้ม) แต่ผมก็ไม่เข้าใจที่ทำไมยังเละเหมือนเดิม)

ในการทดสอบเพิ่มเติม ผมลองลดขนาดตัวอักษร โดยการกดปุ่ม [Ctrl] + [เครื่องหมายลบ] แล้วผมก็เพิ่มขนาดตัวอักษรกลับเข้าไปที่ขนาดเดิม โดยกด [Ctrl] + [เครื่องหมายบวก] ปรากฏว่าเว็บดูได้สวยเหมือน Firefox เวอร์ชั่นตัดคำไทยเด๊ะๆเลยครับ!!

32.png

ผมไม่มีความรู้เรื่อง javascript นะครับ แต่แนวคิดเรื่องการหดแล้วขยายขนาดตัวอักษร น่าจะมีอะไรที่น่าสนใจ ถึงทำให้กระบวนการตัดคำไทยเกิดความสมบูรณ์

ข้อเสนอแนะ:
1. อยากให้ extension นี้มีระบบ enable / disable แบบคลิกเดียวน่ะครับ (แบบ greasemonkey)
2. จากข้อ 1 อยากให้มีระบบ blacklist ไว้เลยครับ ว่าเว็บไหนที่เข้าไปแล้วจะต้องตัดคำ เพราะบางเว็บมันไม่จำเป็น
3. ถ้าเพิ่มกระบวนการประมวลความเร็วในการตัดคำให้เร็วขึ้นกว่านี้ซักนิดดดด จะดีมากครับ

หวังว่าบทความนี้จะมีประโยชน์ในอนาคตไม่มากก็น้อยครับ

/// เพิ่มเติม : ตอนนี้มีทางเลือกที่ดีที่สุด นั่นคือขอแนะนำให้ท่านไปใช้ extension ที่ชื่อ Thai Line-breaking อ่านรายละเอียดได้ที่นี่ครับ

1 Star2 Stars3 Stars4 Stars5 Stars
4.88 เต็ม 5 (จาก 8 ผู้โหวต)

มี 32 ความเห็นที่ 'ว่ากันด้วยเรื่อง “ตัดคำไทย”'

  1. 1 wernwern

    ขอบคุณสำหรับ Extension ดีๆครับหลังจากทนดูเว็บเละๆอยู่นาน

  2. 2 bact'

    โอ้ มีการวิเคราะห์ให้ดูกันจะ ๆ thx!
    (แต่ยังไม่รู้จะแก้ไงหรอกนะ :P)

    ป.ล. Extension ของคุณ vavar น่าจะเร็วกว่า JavaScript ผมนะ ดูจากโค้ดแล้วดีกว่าอ่ะ

  3. 3 BIG_G

    ผมขอแนะนำอีกตัวครับ ใช้ได้ดีเหมือนกัน(ไม่ใช่ของคนไทยนะ)

    ชื่อว่า MR Tech Link Wrapper

    ข้อดี
    1.ใส่ list เวปที่ไม่ให้ตัดได้
    2.มีระบบ enable / disable แบบคลิกเดียว ที่ต้องการ
    3.มี option ให้แก้ไขได้นิดหน่อย
    ข้อเสีย
    1.มันทำงานโดยการจำกัดจำนวนตัวอักษร บางที่จึงมีการตัดกลางคำเลย(เฉพาะภาษาไทย)

  4. 4 ooooo

    โอ๊ะ… ขอบคุณคุณ BIG_G มากครับ ลองแล้วใช้ได้ผลดีทีเดียว
    (ตัดได้เร็วกว่าของ Thai Words Separator นิดหน่อย คงเพราะมันไม่คำนึงถึงโครงสร้างคำเลย)

  5. 5 softganz

    ผมก็ลอง MR Tech Link Wrapper แล้ว กับ FireFox 2 หามานานแล้ว เพิ่งรู้วันนี้เอง ถือว่ารับได้กับการตัดคำที่ไม่ถูกต้อง ยังไงก็เป็นภาษาไทยของเราเอง ตัดคำยังไงก็อ่านได้อยู่ดี แถมยังทำงานกับ version 2.0 ได้ด้วย

    แจ๋วเลยครับ!!!

  6. 6 kittiphat32

    เท่าที่อ่านดู ผมว่าผมยอมรอเวอร์ชั่นตัดคำไทยดีกว่า - -”

  7. 7 vavar

    อะ มี review ด้วย ขอบคุณครับ ^^’
    ว่าแต่ ยังไม่ว่างทำต่อเลย T-T

  8. 8 kittiphat32

    ไม่เป็นไรครับ คุณ vavar ผมรอได้ครับ ผมมั่นใจว่า Extension ตัวนี้ยังไงก็น่าใช้ (ว่าแต่โพสต์ที่แล้วผมว่าคุณทางอ้อมหรือเปล่าหว่า??? ขอโทษด้วยแล้วกันนะครับ)

  9. 9 เก่ง

    เวลาทำเว็บ ผมจะชิงตัดคำเองบ่อย ๆ ครับ พยายามไม่ต้องให้คนอ่าน ต้องทนปวดหัวกับการตัดคำใน firefox ครับ

  10. 10 Anonymous

    Thai Firefox Community Edition 1.5.0.7.1 ออกแล้วครับ ^_^
    http://www.osdev.co.th/File/showdown/30/

  11. 11 subzero

    ขอบคุณมากครับ^^

    เว้นวรรคบ่อยๆเอาละกัน

  12. 12 สัมพันธ์

    ผมกลายเป็นลุงแก่ๆ ไปเสียแล้ว :-)
    เหตุผลที่ออกช้าเข้าใจได้ตรงประเด็นทีเดียวครับ Firefox มันออก update บ่อยจริงๆ
    ซึ่งไม่ได้มีฟีเจอร์เพิ่ม แต่ต้องมา build กันใหม่
    แล้วบางทีตัวติดตั้งก็มีการเปลี่ยนแปลงนิดหน่อยให้คนแก้ไขงงเล่น
    อนาคตจะพยายามหาวิธีที่ดีขึ้นครับ

  13. 13 bow_der_kleine

    ผมเห็นด้วยกับคุณเก่งครับ คือชิงตัดคำเองก่อนดีที่สุด ผมคิดว่า การเขียนภาษาไทยยิ่งเว้นวรรคบ่อย ยิ่งอ่านง่ายขึ้นครับ และผลที่ได้คือ เวบไซท์ที่อ่านง่าย หน้าตาไม่ขึ้นอยู่กับบราวเซอร์ ระบบปฏิบัติการ หรือ extension

    ดังนั้น ผมคิดว่าผู้ที่มีหน้าที่หลักในการตัดคำไม่ใช่ตัวโปรแกรมครับ แต่เป็นตัวคนเขียนมากกว่า

  14. 14 madz_leng

    ถะ..ๆๆ.ๆๆๆๆ.ๆๆๆ ถูกต้องนะคร้าบ

  15. 15 tong053

    ไหนๆ ก็ทำแล้ว น่าจะ review รุ่นตัดคำไทยด้วยเลยนะครับ :P

  16. 16 ooooo

    - พี่ลุง [img]http://www.firefoxthai.com/forum/unb_lib/designs/_smile/unb/13.gif[/img] สัมพันธ์ครับ (รู้มั้ย ชื่อพี่เหมือนผมเลย)
    เป็นผมผมก็เบื่อมานั่ง build เหมือนกันแหละครับ
    (ไม่ build ก็มีคนด่าอีก เวรกรรมจริงๆ)

    - พี่ tong053
    รุ่นตัดคำไทย (ของพี่ลุงสัมพันธ์) เค้าดีจริงนะครับ
    แก้ไขพวกเว็บที่ใช้ justify ให้อ่านรู้เรื่องได้
    แล้วก็มีเมนูภาษาไทยติดมาด้วยล่ะ (จะแบบภาษาอังกฤษก็เลือกได้)

    เอ้อ ลืมไปครับ
    แล้ว firefox 2 มีคนกำลังดำเนินการเรื่องเมนูภาษาไทยรึเปล่าครับตอนนี้ ขอบคุณครับ

  17. 17 Jack The Ripper

    ^
    ^
    ^
    FireFox 2.0 Beta2 มันออกตัวตัดคำไทยมาแล้วนิ

  18. 18 ooooo

    มายฉ่ายๆ
    หมายถึงเมนูที่เป็นภาษาไทยของคุณอิสริยะน่ะครับ
    ตัวเนี้ยะ ที่ลงแล้ว interface การใช้งานจะเป็นภาษาไทยทั้งหมด
    https://addons.mozilla.org/firefox/948/

  19. 19 สัมพันธ์

    ตัวล่าสุดของผม
    Thai Firefox Community Edition 1.5.0.7.1
    http://www.osdev.co.th/File/Download/Mozilla/Firefox/Thai-Firefox-Community-Edition-1.5.0.7.1/
    # เพิ่มความสามารถในการตัดคำให้ถูกต้องในกรณีมีเครื่องหมายวรรคตอน
    # เพิ่มความสามารถในการแสดงผลภาษาไทยแบบ justify ให้ถูกต้อง
    # เลือกภาษา UI ระหว่างไทยกับอังกฤษได้ โดย ชัยวัฒน์ มณีบูลย์
    # ตั้งค่าเพื่อความสะดวกในการใช้ภาษาไทยให้โดยอัตโนมัติในกรณีติดตั้งใหม่
    # พัฒนาจาก Mozilla Firefox 1.5.0.7
    # เพิ่มตัดคำภาษาไทยด้วย ICU
    # user interface ภาษาไทย โดย อิสริยะ ไพรีพ่ายฤทธิ์
    # search plugin ของไทย โดย อาทิตย์ สุริยะวงศ์กุล

    ตัดคำจะแก้ปัญหาเรื่องที่เคยผิดเวลามีเครื่องหมายวรรคตอนอย่างเช่นวงเล็บ
    ส่วนเรื่อง justify ภาษาไทย firefox ทุกตัวจะผิด อยากทดสอบโปรแกรมของตัว
    เองก็ดูได้ที่ http://www.tpschamnong.iirt.net/article/basa_5nt098.html
    ที่ผมชอบคือการตั้งค่าเช่นรหัสและฟอนต์ภาษาไทยให้ เหมาะสำหรับผู้ใช้ครั้งแรก
    ทำให้ประสบการณ์ในการเปลี่ยนมาใช้ FF ดีขึ้น ไม่ต้องตั้งค่าอะไร
    แต่คนเก่าไม่มีผล

  20. 20 Anonymous

    แล้วถ้าจะ Build เองใน Windows ต้องมีอะไรบ้างครับ? ผมจา Build มันทุกอันที่ออกมาเลย -_-)”

  21. 21 Anonymous

    ขออีกคำถามนะครับ ทำไม Mozilla ไม่เอาตัดคำต่างๆเข้าไปในนั้นด้วยเลยครับ?

  22. 22 iannnnn

    โอ้อ้า
    บทความงวดนี้เจ๋งจริงๆ
    ขอบใจมาก ขอบใจมาก

  23. 23 Jack The Ripper

    >> Anonymous Oct 2nd, 2006 at 04:54:19
    >> ขออีกคำถามนะครับ ทำไม Mozilla ไม่เอาตัดคำต่างๆเข้าไปในนั้นด้วยเลยครับ?

    กลัวอ้วน

  24. 24 bact'

    ไปลองตัวนี้ดู

    http://lewcpe.com/blog/archives/313/silver-bullet/

  25. 25 ooooo

    ขอบคุณมากครับคุณ ‘bact

  26. 26 n03e

    ถึงคุณ mk แห่ง blognone ไม่รู้มาอ่านหรือป่าว ผมเจอไอ้นี่ที่เวบท่านด้วย

    http://images.forstudent.com/show.php?id=8cc233d8a1a92ab37347edab700c82d2

  27. 27 unclepiak

    หากปัญหาการตัดคำแล้วทำให้ช้า(ทางฝั่งผู้ใช้) ลองพิจารณาการตัดบางคำแบบเดาคำดูครับ
    เช่นแทรก zero width space เฉพาะคำที่เจอบ่อย ๆ ในทุกบรรทัดประมาณ ๒๐-๓๐ คำเช่น “ด้วย, ไป, ดังนั้น, หาก…”

    ภาระในการแทรกก็จะน้อยลงไปหลายเท่าครับ เท่าที่ลองทำดูใช้งานได้ดีครับ สังเกตดูเพิ่มลดคำที่เหมาะ ๆ จะตัดคำได้ไม่เลว

    สำหรับการทำเว็บผมใช้วิธีเดียวกัน แต่เขียนเป็นสคริ๊ปท์บนฝั่งเซิฟเวอร์เลย (ใช้ร่วมกับฟังก์ชั่นแบนคำหยาบเลยก็ได้) ทำให้ไม่ต้องใช้ extension ก็ดูเว็บไทยได้ดี

  28. 28 unclepiak

    สงสัยผมจะเชย ตะกี้แอบวิวซอร์สหน้านี้ ดูเหมือนจะมีการตัดคำด้วยวิธีคล้ายกัน

  29. 29 krazern

    ลิ้งตัวนี้ Thai Firefox Community Edition 1.5.0.7.1
    http://www.osdev.co.th/File/Download/Mozilla/Firefox/Thai-Firefox-Community-Edition-1.5.0.7.1/ มันโหลดไม่ได้อ่ะครับ มีลิงค์อื่นอีกมั้ย

  30. 30 artster

    ตรงไปตรงมา และเป็นประโยชน์กับผมมากครับ

    ขอบคุณ ขอบคุณ และขอบคุณครับ

  31. 31 386

    เดี๋ยวนี้เครื่อง Core2 คงใช้เวลาไม่นานแล้วครับ

    แต่คนทำดูเหมือนว่าจะไม่สนใจจะทำต่อแล้ว

    จะไม่มีคนรับช่วงต่อเลยเหรอครับนี่

    น่าผิดหวังนะครับ

  32. 32 Redtag

    ทำไมเปิด web pantip.com แสดงรูปไม่ได้ แก้ไขได้หรือไม่ครับ

Leave a Reply

                    





Close
E-mail It
XML-Sitemap
Creative Commons License