Theppitak's blog

My personal blog.

14 เมษายน 2551

OSS Glossary Sprint

นอกจากจะแปล Firefox® แล้ว House 2.0 ยังมีกิจกรรมย่อยที่ทำเพิ่มด้วย คือการเคลียร์ OSS Glossary ที่ทีมแปลใช้ร่วมกัน เป็นกิจกรรมที่นักแปลโครงการต่าง ๆ จะมาร่วมกันทำในระหว่าง standby ที่ห้อง #tlwg โดยในขณะเดียวกัน ก็จะสามารถตอบคำถามให้กับทีมหลัก House 2.0 พร้อมทั้งอัปเดต glossary หากมีประเด็นที่พบระหว่างแปลไปด้วย

การเคลียร์ glossary นี้ ก็มีมูลเหตุอยู่ว่า ปริมาณงานในการดูแล glossary มันมหึมามาก เมื่อเทียบกับกำลังคนที่มี เหตุผลส่วนหนึ่งก็เพราะสมมุติฐานเริ่มแรกของผู้สร้าง (ทีมเนคเทค) กับการใช้งานจริงมันไม่สอดคล้องกัน คือผู้สร้างเริ่มจากเพิ่มรายการคำเข้าไปให้มากที่สุด แล้วคาดหวังว่า จะมีผู้ร่วมสมทบช่วยกันแปล โดยมีทีมหลักคอย approve คำแปลอีกทีหนึ่ง แต่ในการทำงานแปลจริงนั้น คำแปลแต่ละคำต้องมาจากการอภิปรายตกลงกัน โดยใช้ข้อมูลหลาย ๆ ด้านประกอบกัน แล้วใช้ให้เหมือนกัน ดังนั้น กว่าจะได้ข้อสรุปแต่ละคำก็ต้องใช้เวลาพอสมควร แต่ก็เป็นสิ่งทีควรทำ

ดังนั้น OSS Glossary ที่ควรจะเป็นก็คือ เริ่มจากความว่างเปล่า แล้วเพิ่มคำเข้าไปเรื่อย ๆ ตามความต้องการที่เกิดขึ้น แล้วบันทึกผลสรุปที่ได้หลังจากอภิปรายเสร็จ จึงจะทำให้ glossary กับสิ่งที่นักแปลใช้ มีความสอดคล้องกันตลอดเวลา

แต่ในเมื่อ glossary เริ่มสร้างมาจากโจทย์ที่ต่างกัน ปัจจุบันจึงมีรายการส่วนเกินจำนวนมาก และสิ่งที่นักแปลสนใจจะอัปเดตจริง ๆ เป็นแค่ส่วนย่อยบางส่วนเท่านั้น ปริมาณงานที่มากมายเช่นนี้ ประกอบกับกำลังคนที่ลดลงเรื่อย ๆ จึงทำให้นักแปลพาลไม่ใช้ glossary ไปเสียเลย ในขณะที่ผู้มาใหม่ก็งุนงงกับ glossary ที่ล้าสมัย ไม่ตรงกับที่ใช้จริงในโปรแกรม

การเคลียร์ OSS Glossary จึงเกิดขึ้น โดยใช้โอกาสต่าง ๆ เท่าที่จะหาได้ เช่น การทำในเวลาว่างของนักแปล (ซึ่งไม่ค่อยจะมี เพราะที่มาทำงานแปลนี่ก็ใช้เวลาว่างทำอยู่แล้ว) การอัปเดตรายการที่มีข้อสรุปใน mailing list และที่จะคืบหน้าได้มากที่สุดก็คือ ผ่านการระดมกำลังในลักษณะ sprint ซึ่งที่ผ่านมาก็ทำมาแล้วครั้งสองครั้ง และครั้งนี้ก็เป็นอีกครั้งที่เราจะร่วมกันเคลียร์ได้

ossglossary sprint นี้ ไม่ได้มีแผนล่วงหน้า จึงไม่ได้ประกาศล่วงหน้า แต่อาศัยจังหวะที่มี House 2.0 รวมพลในวันหยุดยาว แต่งานรูทีนอย่างนี้ ไม่จำเป็นต้องเตรียมการอะไรมาก นอกจากห้องประชุม IRC และบอกข่าวให้ทั่วถึง

ในการเคลียร์ สิ่งที่จะทำคือ

  • ลบ (reject) คำส่วนเกินออกไป โดยเฉพาะคำที่ไม่ใช่ technical term
  • อภิปรายและ approve หรือ reject คำแปลที่มีผู้เสนอเข้ามา แต่จะไม่พยายามหาข้อสรุปในกรณีที่มีประเด็นละเอียดอ่อน เพื่อไม่ให้เสียเวลามาก สำหรับคำยาก ๆ จะโพสต์ตั้งโจทย์ใน mailing list เพื่อทิ้งไว้อภิปรายกันต่อไป
  • เพิ่มคำแปลให้กับบางคำที่เห็นว่ามีความชัดเจนเพียงพอ

มีเครื่องมือช่วยคือ OSS Corpus ไว้ค้นหาคำแปลเดิมที่มีการแปลไว้ เป็นข้อมูลประกอบ

สองวันที่ผ่านไป มีความคืบหน้าคือ:

  • 12 เม.ย. - approve 56 คำ, reject/delete 49 คำ, เพิ่ม 1 คำ
  • 13 เม.ย. - approve 66 คำ, reject/delete 46 คำ, เพิ่ม 1 คำ

วันนี้จะเป็นวันสุดท้ายของ sprint รอบนี้ ถ้าสนใจก็เชิญได้ที่ห้อง #tlwg นะครับ

ปล. เพื่อให้เห็นปริมาณงานที่เหลือคร่าว ๆ opensource glossary มีคำศัพท์ทั้งหมดประมาณ 4,300 คำ (ยังไม่นับ openoffice glossary ซึ่งมีกว่า 8,000 คำ แต่ไม่แน่ใจว่ามีใครใช้หรือเปล่า) เราทำ sprint เต็มวัน เคลียร์ได้ประมาณ 100 คำ คิดเป็นประมาณ 2.3% จะต้องมี sprint แบบนี้อีกราว 40 ครั้ง จึงจะเสร็จ นี่อาจทำให้เห็นภาพของปัญหาปัจจุบันของ glossary ได้บ้าง

ป้ายกำกับ:

3 ความเห็น:

  • 14 เมษายน 2551 19:27 , Blogger bact' แถลง…

    เยอะมาก ๆ - -"

     
  • 14 เมษายน 2551 21:56 , Blogger Thep แถลง…

    จบวันสุดท้าย approve = 43, reject/delete = 32, add = 4

    รวม 3 วัน: approve = 165, reject/delete = 127, add = 6

    ขอบคุณทุกคนที่มาร่วมด้วยช่วยกันครับ

     
  • 18 เมษายน 2551 15:12 , Blogger bact' แถลง…

    ถ้าเราแยกเฉพาะตัวที่อนุมัติแล้ว จะสะดวกกว่ารึเปล่าครับ ?

    หมายถึงว่าไม่ต้องห่วงเรื่อง reject/delete มาก
    ใช้เฉพาะเท่าที่เจอที่ใช้จริง ๆ
    ถ้าค้นในที่อนุมัติไม่มี ก็ค่อยเสนอเข้ามา (แจ้งว่าพบที่ใช้)
    แล้วอาจจะดึงคำที่มีคนเคยเสนอขึ้นมา
    (แต่ถ้าไม่มีคนแจ้งว่าพบที่ใช้เข้ามา ที่เสนอนั้นก็นอนอยู่เฉย ๆ ไม่ต้องสนใจมัน)

    แบบนี้จะทำให้มี glossary ที่สะท้อนการใช้งานจริง ๆ หรือเปล่าครับ ?

     

แสดงความเห็น (มีการกลั่นกรองสำหรับ blog ที่เก่ากว่า 14 วัน)

<< กลับหน้าแรก

hacker emblem