dc.contributor.author | Yuwono, Elizabeth Irenne | |
dc.date.accessioned | 2022-12-08T03:15:08Z | |
dc.date.available | 2022-12-08T03:15:08Z | |
dc.date.issued | 2014 | |
dc.identifier.uri | http://dspace.uc.ac.id/handle/123456789/5544 | |
dc.description | Berdasarkan data dari Youtube, pada akhir 2011 jumlah total video terkait Hallyu atau budaya Korea telah mencapai 2.3 milyar, meningkat tiga kali lipat dari 2010 (800 juta). Peningkatan popularitas budaya Korea ini berpengaruh pada kemunculan forum - forum penyedia subtitle bahasa Inggris untuk video berbahasa Korea. Pengguna forum ini harus menunggu kurang lebih 2 hari untuk mendapatkannya. SubGen hadir untuk menangkap peluang ini, dengan menyediakan English subtitle generator untuk video berbahasa Korea. Dengan menggunakan SubGen, pengguna dapat lebih cepat memperoleh subtitle bahasa inggris. Melalui penelitian ini diharapkan dapat memberikan kontribusi bagi penelitian terkait Korean natural language processing.
Penelitian ini berfokus pada bagaimana mentransformasi speech to text berdasarkan algoritma semi - continuous Hidden Markov Model (SCHMM) pada bahasa Korea.Pelatihan SCHMM dilakukan menggunakan segmentasi fonem dan estimasi parameter HMM menggunakan algoritma forward - backward. Data referensi yang digunakan meliputi pronunciation dictionary dengan format suku kata hangul, 25 kosa kata numerik dan tempat dalam bahasa Korea, dengan total 225 sampel data. Hasil uji coba pada fase pelatihan SCHMM memiliki akurasi 36%.
Untuk keseluruhan proses uji coba, digunakan 16 video berbahasa Korea dengan konten, jumlah pembicara, dan durasi berbeda. Hasil uji coba untuk fase konversi video ke audio, penerjemahan teks bahasa Korea ke bahasa Inggris dan pembuatan subtitle file dari file teks berhasil dilakukan. Sementara uji coba identifikasi teks bahasa Korea dalam audio menghasilkan akurasi 31%. | en_US |
dc.description.abstract | Berdasarkan data dari Youtube, pada akhir 2011 jumlah total video terkait Hallyu atau budaya Korea telah mencapai 2.3 milyar, meningkat tiga kali lipat dari 2010 (800 juta). Peningkatan popularitas budaya Korea ini berpengaruh pada kemunculan forum - forum penyedia subtitle bahasa Inggris untuk video berbahasa Korea. Pengguna forum ini harus menunggu kurang lebih 2 hari untuk mendapatkannya. SubGen hadir untuk menangkap peluang ini, dengan menyediakan English subtitle generator untuk video berbahasa Korea. Dengan menggunakan SubGen, pengguna dapat lebih cepat memperoleh subtitle bahasa inggris. Melalui penelitian ini diharapkan dapat memberikan kontribusi bagi penelitian terkait Korean natural language processing.
Penelitian ini berfokus pada bagaimana mentransformasi speech to text berdasarkan algoritma semi - continuous Hidden Markov Model (SCHMM) pada bahasa Korea.Pelatihan SCHMM dilakukan menggunakan segmentasi fonem dan estimasi parameter HMM menggunakan algoritma forward - backward. Data referensi yang digunakan meliputi pronunciation dictionary dengan format suku kata hangul, 25 kosa kata numerik dan tempat dalam bahasa Korea, dengan total 225 sampel data. Hasil uji coba pada fase pelatihan SCHMM memiliki akurasi 36%.
Untuk keseluruhan proses uji coba, digunakan 16 video berbahasa Korea dengan konten, jumlah pembicara, dan durasi berbeda. Hasil uji coba untuk fase konversi video ke audio, penerjemahan teks bahasa Korea ke bahasa Inggris dan pembuatan subtitle file dari file teks berhasil dilakukan. Sementara uji coba identifikasi teks bahasa Korea dalam audio menghasilkan akurasi 31%. | en_US |
dc.language.iso | id | en_US |
dc.publisher | Universitas Ciputra Surabaya | en_US |
dc.subject | Video Korea | en_US |
dc.subject | Subtitle | en_US |
dc.subject | Natural Language Processing | en_US |
dc.subject | Speech to Text | en_US |
dc.subject | Hidden Markov Model | en_US |
dc.title | RANCANG - BANGUN MODUL KONVERSI VIDEO BAHASA KOREA KE TEKS BAHASA INGGRIS UNTUK ENGLISH SUBTITLE GENERATOR MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL | en_US |
dc.type | Thesis | en_US |
dc.identifier.nidn | 6014590 | |
dc.identifier.kodeprodi | 55201 | |
dc.identifier.nim | 20110002 | |
dc.identifier.dosenpembimbing | CITRA LESTARI | |