++Update++ โครงการ แปลศัพท์จากภาพยนต์ ผ่าน subtitle
|
 |
จากครั้งก่อนที่เคย post ถามเรื่อง การแปลง subtitle (dreambox)
ตอนนี้เปลี่ยนมาเป็นโปรเจก แปล คำศัพท์จาก subtitle ของภาพยนต์ภาษาอังกฤษแทนครับ
ตอนนี้ทำได้ถึงระดับแปลง subtitle ที่เป็นภาพ ออกมาเป็น Text File แล้วครับ ผลออกมาถือว่าน่าพอใจ (สำหรับผม)
จากการศึกษาของผม ผมก็เพิ่งเข้าใจว่า แผ่น DVD ที่มี subtitle นั้น จริงๆแล้วมันไม่ได้เป็น file text อย่างที่หลายคนอาจเข้าใจ จริงๆแล้วมันคือ"ภาพ" ครับ
เหตุผลที่ว่าทำไมมันเป็นภาพ ก็เพราะว่ามันง่ายต่อการที่เครื่องเล่น DVD จะแสดงผลออกมา เพราะเครื่องเล่น DVD ไม่รู้จัก font นะครับ แล้วถ้ามีภาษาใหม่ๆ อักขระใหม่ๆเกิดขึ้น มันจะอ่านไม่ได้เอา เพื่อตัดปัญหาวุ่นวายตรงนี้ ผู้ผลิตจึงทำให้มันออกมาเป็นภาพแทนยังไงครับ
ดังนั้นมันจึงเป็นความยากของผมที่จะแปลง ภาพออกมาเป็นตัวอักษรก่อน เพื่อนำไปแปลต่ออีกที
ยังไงก็ตามตอนนี้สำเร็จไปมากแล้วครับ
หลังจากนี้คงเอาผลลัพท์ที่ได้ไปผ่านโปรแกรม แก้คำผิด และทำ analysis ว่าคำไหนจะเป็นคำศํพท์ได้บ้าง
พวก A,An,The,Should,Can อะไรง่ายๆพวกนี้จะไม่แปลครับ ไม่งั้นจะเยอะเกินไป
จากนั้นผมจะเอาคำที่วิเคราะห์ได้ ไปผ่าน dictionary database ที่จัดเตรียมไว้แล้วอีกทีนึง ยังอยู่ในขั้นทดสอบ นะครับ ใครมีอะไรแนะนำขอความเห็นด้วยนะครับ http://www.youtube.com/watch?v=K-I3mso-W2U รบกวน post vdo ให้ด้วยครับ
จากคุณ |
:
ฮามโมจิ
|
เขียนเมื่อ |
:
1 มิ.ย. 54 22:02:33
A:58.64.111.43 X: TicketID:295959
|
|
|
|