Theppitak's blog

My personal blog.

11 กุมภาพันธ์ 2556

swath 0.5.0

swath 0.5.0 ออกแล้ว ถือเป็นชุดเดียวกันกับ thailatex 0.5.1 และ libthai 0.1.19 ที่ออกไปก่อนหน้านี้ในแง่ของพจนานุกรมที่ใช้ในการตัดคำและในการสร้าง hyphenation pattern แต่ยังมีการเปลี่ยนแปลงอย่างอื่นอีกมากมายที่ทำให้ปรับ minor version ขึ้นเป็น 0.5.0

รายละเอียดเคย blog ไว้เมื่อปีกลาย เป็นการเปลี่ยนโครงสร้างโปรแกรมขนานใหญ่พอสมควร แม้ engine สำหรับตัดคำจะยังเหมือนเดิมก็ตาม โดยสรุปคือ:

  • ปรับโครงสร้างการแปลงรหัสอักขระ TIS-620 กับ UTF-8 โดยให้ผลลัพธ์ทันทีโดยไม่ทำบัฟเฟอร์ผ่านแฟ้มชั่วคราว
  • ผลข้างเคียงคือ ได้รื้อโค้ดส่วนจัดการเอกสาร RTF เขียนใหม่ทั้งหมด พร้อมกับทดสอบกับเอกสารจริงด้วย
  • เปลี่ยนการประมวลผลอักขระภายในจาก มอก. 620 มาเป็นยูนิโค้ด เพื่อรักษาอักขระยูนิโค้ดในข้อมูลขาเข้าที่ไม่ใช่ไทย-อังกฤษไว้ในผลลัพธ์ขาออกด้วย
  • ผลข้างเคียงของงานข้างต้นอีกอย่างคือ โค้ดถูกทำความสะอาดครั้งใหญ่อีกครั้ง (แต่ยังเหลืออีกเยอะ)
  • แก้ security bug ตามที่ได้รับรายงาน

และเช่นกัน swath รุ่นนี้เป็นรุ่นแรกที่ใช้ XZ tarball compression ซึ่งลดขนาดลงถึง 33%

-rw-r--r-- 1 thep thep 490028 ก.พ.  11 15:05 swath-0.5.0.tar.gz
-rw-r--r-- 1 thep thep 328292 ก.พ.  11 12:11 swath-0.5.0.tar.xz

อัปโหลดเข้า Debian experimental เรียบร้อยครับ พบได้ที่ Debian mirror ใกล้บ้านท่าน

ป้ายกำกับ:

5 ความเห็น:

  • 26 พฤศจิกายน 2556 14:28 , Blogger Panupong Kongarn แถลง…

    ผมใช้ swath v.0.4 แต่เห็นว่า v.0.5 มี update-dict แต่ว่าผมลง v.0.5 ไม่ได้ติดเลือด automake aclocal 1.14 เลยอยากรบกวนขอ swathdic.tri ของ v.0.5 เลยจะได้มั้ยครับ เพราะว่ามีทั้งชื่อเมือง ประเทศ ฯลฯ เพิ่มขึ้นมาเยอะเลยนะครับ

     
  • 26 พฤศจิกายน 2556 20:06 , Blogger Thep แถลง…

    เอา data จาก source ของ 0.5 ไปใส่ในไดเรกทอรี data/ แล้วก็ build เอาก็ได้นะครับ

     
  • 27 พฤศจิกายน 2556 10:58 , Blogger Panupong Kongarn แถลง…

    ขอบคุณมากครับ ผมเปลี่ยน data ของ 0.4 เป็นใช้ data ของ 0.5 แล้วลอง build ใหม่ (./configure และ make install) แต่มัน error ตอน make install ตามรูปนะครับ http://kongarn.com/images/swath_data_0.5_instead_0.4_build_error.png
    แต่ถ้าใช้ของ 0.4 ก็ build ได้ปกติ

     
  • 27 พฤศจิกายน 2556 12:23 , Blogger Thep แถลง…

    0.4 นี่ ผมหมายถึง 0.4.3 นะครับ ถ้าเก่ากว่านี้ ระบบ build จะเป็นคนละแบบกับ 0.5.x ครับ

     
  • 27 พฤศจิกายน 2556 13:28 , Blogger Panupong Kongarn แถลง…

    ขอบคุณมากเลยครับ คุณเทพ ผมใช้ 0.4.3 ไปเลย เพราะ data มันมีเพิ่มดิคเหมือนกันกับ 0.5 เลยครับ
    สรุปทำได้แล้วครับ

     

แสดงความเห็น (มีการกลั่นกรองสำหรับ blog ที่เก่ากว่า 14 วัน)

<< กลับหน้าแรก

hacker emblem