Theppitak's blog: OSS Glossary Sprint

นอกจากจะแปล Firefox® แล้ว House 2.0 ยังมีกิจกรรมย่อยที่ทำเพิ่มด้วย คือการเคลียร์ OSS Glossary ที่ทีมแปลใช้ร่วมกัน เป็นกิจกรรมที่นักแปลโครงการต่าง ๆ จะมาร่วมกันทำในระหว่าง standby ที่ห้อง #tlwg โดยในขณะเดียวกัน ก็จะสามารถตอบคำถามให้กับทีมหลัก House 2.0 พร้อมทั้งอัปเดต glossary หากมีประเด็นที่พบระหว่างแปลไปด้วย

การเคลียร์ glossary นี้ ก็มีมูลเหตุอยู่ว่า ปริมาณงานในการดูแล glossary มันมหึมามาก เมื่อเทียบกับกำลังคนที่มี เหตุผลส่วนหนึ่งก็เพราะสมมุติฐานเริ่มแรกของผู้สร้าง (ทีมเนคเทค) กับการใช้งานจริงมันไม่สอดคล้องกัน คือผู้สร้างเริ่มจากเพิ่มรายการคำเข้าไปให้มากที่สุด แล้วคาดหวังว่า จะมีผู้ร่วมสมทบช่วยกันแปล โดยมีทีมหลักคอย approve คำแปลอีกทีหนึ่ง แต่ในการทำงานแปลจริงนั้น คำแปลแต่ละคำต้องมาจากการอภิปรายตกลงกัน โดยใช้ข้อมูลหลาย ๆ ด้านประกอบกัน แล้วใช้ให้เหมือนกัน ดังนั้น กว่าจะได้ข้อสรุปแต่ละคำก็ต้องใช้เวลาพอสมควร แต่ก็เป็นสิ่งทีควรทำ

ดังนั้น OSS Glossary ที่ควรจะเป็นก็คือ เริ่มจากความว่างเปล่า แล้วเพิ่มคำเข้าไปเรื่อย ๆ ตามความต้องการที่เกิดขึ้น แล้วบันทึกผลสรุปที่ได้หลังจากอภิปรายเสร็จ จึงจะทำให้ glossary กับสิ่งที่นักแปลใช้ มีความสอดคล้องกันตลอดเวลา

แต่ในเมื่อ glossary เริ่มสร้างมาจากโจทย์ที่ต่างกัน ปัจจุบันจึงมีรายการส่วนเกินจำนวนมาก และสิ่งที่นักแปลสนใจจะอัปเดตจริง ๆ เป็นแค่ส่วนย่อยบางส่วนเท่านั้น ปริมาณงานที่มากมายเช่นนี้ ประกอบกับกำลังคนที่ลดลงเรื่อย ๆ จึงทำให้นักแปลพาลไม่ใช้ glossary ไปเสียเลย ในขณะที่ผู้มาใหม่ก็งุนงงกับ glossary ที่ล้าสมัย ไม่ตรงกับที่ใช้จริงในโปรแกรม

การเคลียร์ OSS Glossary จึงเกิดขึ้น โดยใช้โอกาสต่าง ๆ เท่าที่จะหาได้ เช่น การทำในเวลาว่างของนักแปล (ซึ่งไม่ค่อยจะมี เพราะที่มาทำงานแปลนี่ก็ใช้เวลาว่างทำอยู่แล้ว) การอัปเดตรายการที่มีข้อสรุปใน mailing list และที่จะคืบหน้าได้มากที่สุดก็คือ ผ่านการระดมกำลังในลักษณะ sprint ซึ่งที่ผ่านมาก็ทำมาแล้วครั้งสองครั้ง และครั้งนี้ก็เป็นอีกครั้งที่เราจะร่วมกันเคลียร์ได้

ossglossary sprint นี้ ไม่ได้มีแผนล่วงหน้า จึงไม่ได้ประกาศล่วงหน้า แต่อาศัยจังหวะที่มี House 2.0 รวมพลในวันหยุดยาว แต่งานรูทีนอย่างนี้ ไม่จำเป็นต้องเตรียมการอะไรมาก นอกจากห้องประชุม IRC และบอกข่าวให้ทั่วถึง

ในการเคลียร์ สิ่งที่จะทำคือ

ลบ (reject) คำส่วนเกินออกไป โดยเฉพาะคำที่ไม่ใช่ technical term
อภิปรายและ approve หรือ reject คำแปลที่มีผู้เสนอเข้ามา แต่จะไม่พยายามหาข้อสรุปในกรณีที่มีประเด็นละเอียดอ่อน เพื่อไม่ให้เสียเวลามาก สำหรับคำยาก ๆ จะโพสต์ตั้งโจทย์ใน mailing list เพื่อทิ้งไว้อภิปรายกันต่อไป
เพิ่มคำแปลให้กับบางคำที่เห็นว่ามีความชัดเจนเพียงพอ

มีเครื่องมือช่วยคือ OSS Corpus ไว้ค้นหาคำแปลเดิมที่มีการแปลไว้ เป็นข้อมูลประกอบ

สองวันที่ผ่านไป มีความคืบหน้าคือ:

12 เม.ย. - approve 56 คำ, reject/delete 49 คำ, เพิ่ม 1 คำ
13 เม.ย. - approve 66 คำ, reject/delete 46 คำ, เพิ่ม 1 คำ

วันนี้จะเป็นวันสุดท้ายของ sprint รอบนี้ ถ้าสนใจก็เชิญได้ที่ห้อง #tlwg นะครับ

ปล. เพื่อให้เห็นปริมาณงานที่เหลือคร่าว ๆ opensource glossary มีคำศัพท์ทั้งหมดประมาณ 4,300 คำ (ยังไม่นับ openoffice glossary ซึ่งมีกว่า 8,000 คำ แต่ไม่แน่ใจว่ามีใครใช้หรือเปล่า) เราทำ sprint เต็มวัน เคลียร์ได้ประมาณ 100 คำ คิดเป็นประมาณ 2.3% จะต้องมี sprint แบบนี้อีกราว 40 ครั้ง จึงจะเสร็จ นี่อาจทำให้เห็นภาพของปัญหาปัจจุบันของ glossary ได้บ้าง

ป้ายกำกับ: translation

3 ความเห็น:

ณ 14 เมษายน 2551 เวลา 19:27 , bact' แถลง…

เยอะมาก ๆ - -"
ณ 14 เมษายน 2551 เวลา 21:56 , Thep แถลง…

จบวันสุดท้าย approve = 43, reject/delete = 32, add = 4

รวม 3 วัน: approve = 165, reject/delete = 127, add = 6

ขอบคุณทุกคนที่มาร่วมด้วยช่วยกันครับ
ณ 18 เมษายน 2551 เวลา 15:12 , bact' แถลง…

ถ้าเราแยกเฉพาะตัวที่อนุมัติแล้ว จะสะดวกกว่ารึเปล่าครับ ?

หมายถึงว่าไม่ต้องห่วงเรื่อง reject/delete มาก
ใช้เฉพาะเท่าที่เจอที่ใช้จริง ๆ
ถ้าค้นในที่อนุมัติไม่มี ก็ค่อยเสนอเข้ามา (แจ้งว่าพบที่ใช้)
แล้วอาจจะดึงคำที่มีคนเคยเสนอขึ้นมา
(แต่ถ้าไม่มีคนแจ้งว่าพบที่ใช้เข้ามา ที่เสนอนั้นก็นอนอยู่เฉย ๆ ไม่ต้องสนใจมัน)

แบบนี้จะทำให้มี glossary ที่สะท้อนการใช้งานจริง ๆ หรือเปล่าครับ ?