Terjemahan HTML

Terjemahan HTML yang mempertahankan markup Anda.

Tag tetap tag. Atribut tetap atribut. Nama kelas, nilai href, atribut data — tidak ada yang berubah. Hanya teks yang terlihat yang benar-benar dibaca pengguna Anda yang diterjemahkan.

Tag
selalu dipertahankan
Class/ID
atribut tidak disentuh
href/src
tidak pernah diterjemahkan
36
bahasa target

Markup yang rusak lebih buruk daripada tidak ada terjemahan.

Mengirim HTML melalui API terjemahan standar berisiko. Tag diterjemahkan sebagian. Nilai atribut menjadi rusak. Nama kelas yang seharusnya tidak berubah malah berubah. Output terlihat benar dalam teks biasa tetapi rusak di browser — dan rusak secara diam-diam. Untuk situs dengan konten berat atau ekspor CMS, memperbaiki HTML yang rusak di 10 bahasa bukanlah alur kerja yang masuk akal.

Lebih buruk lagi, API terjemahan standar sering menerjemahkan konten yang seharusnya tidak pernah berubah — nama kelas CSS, URL href, atribut src, label aria yang berisi pengenal teknis, dan atribut data. HTML yang dihasilkan tidak lagi dirender dengan benar, dan beberapa perubahan cukup halus sehingga lolos pengujian visual sebelum menyebabkan kesalahan saat runtime.

Untuk HTML yang dihasilkan CMS, template email, atau HTML yang diproses secara programatik, perbaikan pasca-terjemahan bukanlah pilihan. Ini menjadi biaya pemeliharaan tersembunyi yang bertambah dengan setiap pembaruan konten.

PolyLingo mem-parsing DOM sebelum menerjemahkan.

PolyLingo memperlakukan HTML Anda sebagai dokumen, bukan string. Ia menelusuri struktur DOM, mengidentifikasi node teks yang berisi konten yang terlihat, dan hanya mengirimkan node tersebut ke model terjemahan. Nama tag, nilai atribut, nama kelas, nilai href, atribut data — tidak ada struktur yang pernah dilihat oleh model terjemahan. HTML output valid dan secara struktural identik dengan yang Anda kirimkan.

PolyLingo menggunakan parser DOM daripada memperlakukan HTML sebagai teks mentah. Sebelum terjemahan terjadi, HTML diurai menjadi pohon node. Setiap node diklasifikasikan: node teks yang berisi bahasa alami diekstrak untuk diterjemahkan, sementara node elemen, nilai atribut yang bukan linguistik (nama kelas, ID, href, src, atribut data), dan konten yang tidak dapat diterjemahkan (skrip, gaya, blok kode) sepenuhnya dikecualikan.

Node teks yang diterjemahkan kemudian dimasukkan kembali ke dalam struktur DOM asli. HTML yang dihasilkan secara semantik setara dengan sumber, dengan penempatan tag, nilai atribut, dan markup struktural yang identik. Hanya teks yang terlihat yang berubah.

Input — artikel HTML (Bahasa Inggris)
<article class="post">
  <h1 class="post-title">How to build a multilingual site</h1>
  <p>Building a <strong>multilingual website</strong> doesn't have to be
  complicated. The key is choosing the right translation layer.</p>
  <a href="/pricing" class="cta-button" aria-label="View pricing">
    See our plans
  </a>
  <img src="/hero.png" alt="Multilingual platform dashboard" />
</article>
Output — Prancis (tag dan atribut tetap)
<article class="post">
  <h1 class="post-title">Comment créer un site multilingue</h1>
  <p>Créer un <strong>site web multilingue</strong> n'a pas à être
  compliqué. La clé est de choisir la bonne couche de traduction.</p>
  <a href="/pricing" class="cta-button" aria-label="Voir les tarifs">
    Voir nos offres
  </a>
  <img src="/hero.png" alt="Tableau de bord de la plateforme multilingue" />
</article>

Apa yang diterjemahkan vs apa yang dipertahankan

DiterjemahkanDipertahankan
Konten teks di antara tagyatidak
Atribut title (label aksesibilitas)yatidak
Teks alt pada gambaryatidak
Atribut aria-labelyatidak
Teks placeholder di inputyatidak
Nama tag HTMLtidakya
Atribut kelas dan IDtidakya
URL href dan srctidakya
Atribut datatidakya
Blok skrip dan gayatidakya

Apa yang ditangani PolyLingo dalam setiap terjemahan HTML

  • Nama tag dan struktur tidak pernah diubah
  • Nama kelas, ID, atribut data tidak disentuh
  • Nilai href dan src tautan dipertahankan persis
  • Hanya node teks yang terlihat yang diterjemahkan
  • Bahasa RTL: atribut dir ditangani dengan benar
  • Bekerja dengan halaman penuh, fragmen, dan komponen
  • HTML bersarang — kedalaman apapun dari penempatan elemen ditangani dengan benar
  • HTML email — gaya inline dan tata letak berbasis tabel dipertahankan

Cara menerjemahkan konten HTML dengan PolyLingo

1

Kirim HTML Anda ke API

POST konten HTML Anda ke /v1/translate. Atur format ke "html" atau abaikan — PolyLingo secara otomatis mendeteksi HTML dari konten. Sertakan kode bahasa target Anda.

2

Terima HTML terjemahan yang bersih

Respons berisi satu string HTML terjemahan per bahasa target. Setiap tag, kelas, ID, dan atribut persis seperti yang Anda kirim. Hanya teks bahasa alami yang berubah.

3

Tulis ke CMS, template, atau file Anda

Gunakan HTML terjemahan langsung di CMS, pembuat email, generator situs statis, atau alat lain yang menggunakan HTML. Tidak perlu pemrosesan ulang atau perbaikan.

Dimana terjemahan HTML dibutuhkan

🖥️

Ekspor halaman dan posting CMS

Platform CMS headless menyimpan konten sebagai HTML atau teks kaya yang diserialisasi ke HTML. PolyLingo menerjemahkan konten ini untuk setiap lokal sambil mempertahankan struktur dan format yang dibuat CMS.

📧

Template email

HTML email terkenal rapuh — tata letak berbasis tabel, gaya inline, dan struktur bersarang dalam rusak saat diterjemahkan secara naif. PolyLingo mempertahankan semuanya.

🏪

Deskripsi produk e-commerce

Deskripsi produk sering berisi HTML yang diformat dengan daftar bergaya, teks tebal, dan konten terstruktur. Menerjemahkannya dalam skala besar membutuhkan pelestarian format yang tepat agar output dirender konsisten di berbagai bahasa.

Pertanyaan yang sering diajukan tentang terjemahan HTML

Apakah PolyLingo menerjemahkan atribut seperti title dan alt text?

Ya. Atribut alt pada gambar, atribut title pada elemen, atribut aria-label, dan atribut placeholder pada input form diidentifikasi mengandung teks bahasa alami dan diterjemahkan. Atribut href dan src, nama kelas, ID, dan atribut data tidak diterjemahkan.

Bagaimana dengan JavaScript inline atau atribut style?

Tag skrip dan tag gaya tidak pernah diterjemahkan — isinya diteruskan tanpa perubahan. Atribut gaya inline (style="...") juga dipertahankan persis. Satu-satunya konten yang diterjemahkan adalah teks bahasa alami.

Apakah PolyLingo dapat menangani HTML halaman penuh termasuk doctype dan head?

Ya. PolyLingo dapat menangani dokumen HTML penuh termasuk doctype, head, dan body. Elemen title, meta deskripsi, dan tag Open Graph di head dapat diterjemahkan. URL kanonik, meta charset, dan tag meta teknis dipertahankan tanpa perubahan.

Apakah ini bekerja dengan HTML yang dihasilkan editor teks kaya seperti ProseMirror atau TipTap?

Ya. Output HTML dari editor teks kaya diserialisasi ke HTML standar. PolyLingo menangani HTML valid apapun tanpa memandang bagaimana itu dihasilkan. Parser DOM bekerja dari string HTML itu sendiri, bukan dari format khusus editor.

Apa yang terjadi dengan entitas HTML seperti &amp; atau &copy;?

Entitas HTML didekode sebelum terjemahan dan dienkode ulang dalam output. Entitas bernama seperti &amp;, &copy;, dan &mdash; dipertahankan. Entitas numerik juga ditangani dengan benar. Output terjemahan menggunakan pengkodean entitas yang sama seperti sumber.

Apakah ada batas ukuran file untuk terjemahan HTML?

Permintaan terjemahan individual dibatasi hingga 64KB konten. Untuk dokumen yang lebih panjang (artikel panjang, halaman penuh), pendekatan yang disarankan adalah membagi pada batas alami (bagian, artikel) dan merakit kembali setelah terjemahan. Ini juga membantu akurasi penggunaan token.

Terjemahkan HTML Anda tanpa perlu pembersihan.

Tingkat gratis. Tanpa kartu kredit. HTML valid keluar dari sisi lain.

Mulai terjemahkan gratis

Tempelkan HTML apapun dan lihat persis apa yang diterjemahkan dan apa yang tidak.

Terjemahan HTML yang mempertahankan markup Anda — PolyLingo | PolyLingo