Peran Pemrosesan Auditori Domain-Umum dalam Pembelajaran Ucapan Bahasa Kedua Ditinjau Kembali: Tingkat Presisi Apa yang Membuat Perbedaan?

Abstrak
Studi ini memperluas aplikasi praktis dari peran penting pemrosesan auditori dalam laju perolehan ujaran L2 naturalistik. Dalam Studi 1, produksi prosodi Bahasa Inggris oleh 46 mahasiswa Tiongkok dilacak selama program studi luar negeri lima bulan di Inggris. Pembelajar dengan kesempatan masukan L2 yang luas menunjukkan peningkatan dalam akurasi prosodi; namun, mereka yang memiliki ketajaman nada di bawah ambang batas tertentu menunjukkan regresi, yang berpotensi memperkuat interferensi L1. Untuk menentukan persentase peserta yang berada di bawah ambang batas pemrosesan auditori yang ditentukan dalam Studi 1, Studi 2 memberikan tes pemrosesan nada kepada 400 mahasiswa Tiongkok yang belajar Bahasa Inggris, semuanya dengan pendengaran normal, dan mengembangkan korpus sementara untuk menilai variasi ketajaman nada dalam kelompok ini. Perbandingan temuan dari Studi 1 dan 2 menunjukkan bahwa presisi auditori yang tidak memadai menghambat pembelajaran L2 naturalistik. Kira-kira 1,5 kuartil terbawah dari populasi (35%) mungkin berada di bawah ambang batas ini. Pembelajar ini dapat memperoleh manfaat dari strategi perbaikan (misalnya, instruksi fonetik eksplisit, pelatihan auditori) untuk memanfaatkan sepenuhnya kesempatan belajar L2 naturalistik mereka.

Perkenalan
Selama 30 tahun terakhir, para akademisi telah meneliti mekanisme yang mendasari laju dan pencapaian akhir kemahiran berbicara bahasa kedua (L2) dalam kaitannya dengan berbagai variabel ekstrinsik pembelajar. Ini termasuk waktu pendalaman dalam lingkungan berbahasa L2 (usia kedatangan), lamanya pendalaman (kuantitas masukan), frekuensi harian penggunaan L2 dengan pembicara yang fasih versus yang tidak fasih (kualitas masukan), dan latar belakang pendidikan (misalnya, lama dan permulaan pendidikan L2, adanya pelatihan pengucapan dan musik; untuk ringkasan yang komprehensif, lihat Flege & Bohn, 2021 ). Sementara variabel-variabel ini menunjukkan daya prediktif berukuran sedang untuk berbagai hasil bicara L2 (misalnya, r = .30–.50; Saito, 2015 ), mereka sendiri tidak dapat menjelaskan semua varians. Hal ini menunjukkan bahwa bahkan jika peserta didik terlibat dalam jumlah dan jenis kesempatan latihan yang sama, akan ada banyak variabilitas individu, dengan beberapa peserta didik berhasil mengembangkan kemahiran berbicara L2 tingkat lanjut dan peserta didik lainnya mengalami kesulitan meskipun masukan dan keluarannya cukup.

Mengacu pada teori-teori tentang fondasi auditori dari perolehan bahasa pertama (L1) (Goswami, 2015 ; Tallal & Gaab, 2006 ; Tierney & Kraus 2014 ), para akademisi telah menghubungkan variasi individu dalam hasil pembelajaran L2 dengan perbedaan individu dalam kemampuan untuk mengodekan karakteristik akustik bunyi. Di bawah penjelasan persepsi perolehan bahasa, pemrosesan auditori dianggap sebagai hambatan untuk pembelajaran bahasa yang sukses; ini berfungsi sebagai kemampuan awal yang diandalkan pembelajar untuk analisis fonetik dan fonologis saat menerima masukan auditori, yang memengaruhi proses selanjutnya pada tingkat leksikal, morfosintaksis, dan diskursus. Dalam konteks perolehan L1, penelitian ekstensif menunjukkan bahwa anak-anak dengan presisi auditori yang lebih rendah biasanya menunjukkan perkembangan bahasa yang lebih lambat (Kalashnikova et al., 2019 ) dan kemungkinan lebih tinggi mengalami gangguan bahasa seperti disleksia (Boets et al., 2011 ) dan gangguan bahasa tertentu (McArthur & Bishop, 2005 ). Menurut meta-analisis McWeeny dan Norton ( 2024 ), perbedaan berbagai jenis pemrosesan pendengaran antara kelompok normal dan disleksia dapat bermanifestasi sebagai efek sedang hingga besar ( g = 0,70–0,80).

Beberapa akademisi telah mendalilkan bahwa dampak pemrosesan auditori dapat meluas ke konteks pembelajaran L2 (Mueller et al., 2012 ). Pembahasan yang lebih baru menunjukkan bahwa efek ini bahkan dapat diamati lebih jelas dalam pemerolehan L2 daripada pemerolehan L1 karena perbedaan mendasar dalam kuantitas dan kualitas pengalaman belajar (Saito et al., 2020 ). Dalam pemerolehan L1, individu dengan defisit pemrosesan auditori dapat mengompensasi melalui masukan linguistik yang konsisten dan kaya yang diberikan oleh pengasuh (misalnya, Rosen, 2003 ). Selama paparan yang begitu banyak, individu dengan presisi auditori yang relatif rendah dapat mengadopsi strategi perbaikan untuk memahami ucapan dengan memanfaatkan redundansi dalam pemrosesan ucapan. Misalnya, individu dengan amusia dapat menunjukkan ucapan dan pemrosesan musik yang normal sambil mengandalkan isyarat durasional daripada isyarat nada (Jasmin et al., 2020 ). Pendengar asli juga dapat menggunakan isyarat semantik ketika isyarat fonetik tidak dapat diakses dengan jelas (Bradlow & Alexander, 2007 ). Namun, dalam pembelajaran L2, peserta didik memiliki akses ke input dan output dalam jumlah terbatas. Oleh karena itu, kekurangan dalam ketepatan pendengaran dapat menghambat kemampuan mereka untuk sepenuhnya memanfaatkan peluang input dan output yang sudah terbatas.

Selain itu, pemrosesan auditori dalam pembelajaran L2 dapat dianggap sebagai tugas ganda dan dengan demikian lebih kompleks dan menuntut daripada dalam pembelajaran L1. Tidak seperti pemerolehan L1, yang terjadi bebas dari pengalaman belajar bahasa sebelumnya, pemerolehan L2 terjadi dalam ruang fonetik dan fonologis tempat sistem L1 sudah terbentuk (sepenuhnya atau sebagian). Saat terpapar bunyi L2, pembelajar perlu mengodekan sifat akustik mereka sambil menekan interferensi L1. Kemudian, mereka perlu membandingkannya dengan bunyi-bunyi L1, memutuskan apakah akan mengasimilasi atau mendisimilasi bunyi-bunyi ini (Flege & Bohn, 2021 ). Kerugian apa pun yang dimiliki pembelajar dalam hal ketergantungan mereka pada pemrosesan auditori pada tingkat domain-umum dapat segera memengaruhi kemampuan mereka untuk mempertahankan atau memisahkan dua sistem fonetik dan fonologis secara efektif dan efisien.

Penelitian terkini telah menunjukkan efek positif dan negatif dari pemrosesan auditori dalam pembelajaran bicara L2. Di satu sisi, pembelajar L2 yang telah mencapai kemahiran bicara L2 tingkat lanjut cenderung memiliki tingkat presisi auditori yang relatif tinggi (atau setidaknya normatif) (Saito, Sun et al., 2022 ). Kekuatan prediktif pemrosesan auditori untuk pembelajaran bicara L2 yang berhasil adalah sedang hingga besar bahkan setelah memperhitungkan perbedaan individu yang terkait dengan pengalaman dan kognitif (misalnya, R 2 > .50; Saito et al., 2024 ).

Di sisi lain, individu dengan presisi pendengaran yang lebih rendah cenderung berjuang untuk menganalisis suara baru karena gangguan L1, yang akhirnya menghambat keberhasilan pembelajaran bicara L2. Bukti yang muncul menunjukkan bahwa kerugian pendengaran ini dapat diamati dalam kondisi yang naturalistis, autentik secara komunikatif, dan akibatnya menantang bagi pelajar L2. Konteks ini mencakup tidak hanya pencelupan naturalistis (misalnya, belajar di luar negeri) tetapi juga instruksi berorientasi makna di mana pelajar terlibat dalam memproses bahasa melalui tugas percakapan kehidupan nyata (misalnya, pengajaran bahasa berbasis tugas; Ruan & Saito, 2023 ; Xu et al., sedang diterbitkan ) dan/atau paradigma pelatihan insidental dan implisit (misalnya, Correia et al., sedang diterbitkan ) dengan masukan alami (misalnya, paparan intensif ke banyak pembicara; Chandrasekaran et al., 2010 ; Perrachione et al., 2011 ; W. Zhang et al., 2024 ).

Satu pesan penting untuk praktisi (guru dan pembelajar bahasa) adalah bahwa penjelasan pemrosesan auditori dari pembelajaran ujaran L2 dapat meletakkan dasar untuk pendekatan individual untuk pembelajar L2 dengan profil pemrosesan auditori yang beragam. Untuk membantu pembelajar mengembangkan dan mengotomatiskan pengetahuan L2 mereka dan menjadi pengguna L2 yang fungsional, pengalaman dan pelatihan pembelajaran L2 yang autentik secara komunikatif sangat penting (Suzuki, 2023 ). Namun, sementara pendekatan seperti itu dapat menguntungkan pembelajar L2 dengan setidaknya presisi auditori normatif, mereka yang memiliki presisi auditori yang lebih rendah mungkin menunjukkan kemajuan yang terbatas (Perrachione et al., 2011 ). Pembelajar yang kurang beruntung dalam hal auditori ini dapat memperoleh manfaat dari kombinasi pelatihan bahasa dan pemrosesan auditori (Saito, Petrova et al., 2022 ) dan/atau instruksi fonetik yang terperinci dan eksplisit (Suzukida & Saito, 2023 ) sebelum terlibat dalam wacana yang berorientasi pada makna. Orang-orang ini tidak selalu kekurangan dalam beberapa hal; sebaliknya, pelajar dengan profil pendengaran yang berbeda mungkin memerlukan bentuk instruksi yang berbeda (McMurray et al., 2023 ).

Penting untuk menyadari bahwa pemrosesan pendengaran berfungsi sebagai variabel berkelanjutan, dan hubungan bakat-perolehan yang diidentifikasi dalam literatur sebelumnya masih sangat abstrak tentang tingkat ketepatan pendengaran yang diperlukan untuk meningkatkan pembelajaran bicara L2. Biasanya, penelitian menunjukkan bahwa pelajar dengan bakat yang lebih tinggi menunjukkan kemahiran L2 yang lebih maju, sedangkan mereka yang memiliki bakat yang lebih rendah menunjukkan pembelajaran L2 yang terbatas. Namun, penelitian ini sering kali menghindari identifikasi ambang batas tertentu untuk ketepatan pendengaran, memperlakukan dampak ketajaman pendengaran sebagai gradien.

Namun, dalam praktiknya, keputusan yang dibuat oleh praktisi mungkin lebih bersifat dikotomis. Untuk tujuan praktis dan pedagogis, penting bagi praktisi untuk tidak hanya mendiagnosis profil pemrosesan pendengaran peserta didik tetapi juga menafsirkan signifikansinya. Mengidentifikasi peserta didik dengan presisi pendengaran yang relatif rendah sangat penting untuk memberikan dukungan yang disesuaikan, memastikan bahwa semua peserta didik dapat memaksimalkan peluang masukan mereka untuk meningkatkan pembelajaran bicara L2 yang optimal, terlepas dari perbedaan persepsi mereka.

Satu upaya penting dan luar biasa untuk menyediakan interpretasi kategoris dari pemrosesan auditori adalah karya penting oleh Wong dan Perrachione (Perrachione et al., 2011 ; Wong & Perrachione, 2007 ). Penelitian mereka menyelidiki bagaimana perbedaan individu dalam pemrosesan nada berinteraksi dengan paradigma pelatihan dalam perolehan kontras fonologis baru yang melibatkan nada. Peserta pertama-tama menyelesaikan tes diskriminasi nada internal tim dan kemudian serangkaian sesi pelatihan. Hasilnya menunjukkan bahwa mereka yang mendapat skor di atas 70% pada tes nada lebih mungkin berhasil memperoleh kontras fonologis berbasis nada baru (Wong & Perrachione, 2007 ). Selain itu, pelajar di atas ambang batas 70% mendapat manfaat dari pelatihan variabilitas tinggi, sedangkan mereka yang di bawah ambang batas berperforma lebih baik dalam lingkungan pelatihan variabilitas rendah. Temuan-temuan ini menawarkan wawasan berharga untuk pengembangan teoritis dan aplikasi praktis, yang menunjukkan bahwa praktisi dapat menilai kemampuan pemrosesan nada pelajar terlebih dahulu dan merekomendasikan pendekatan pelatihan fonetik yang paling tepat (pelatihan variabilitas tinggi bagi mereka dengan ketajaman nada tinggi vs. pelatihan variabilitas rendah bagi mereka dengan ketajaman nada rendah). Baru-baru ini, tim kami telah membuat seperangkat alat penilaian pemrosesan pendengaran dan manual pengguna yang tersedia untuk umum bagi para peneliti dan praktisi, yang memungkinkan evaluasi yang akurat dari berbagai dimensi pemrosesan pendengaran (Saito & Tierney, 2024 ). Mengingat hal ini, kami berpendapat bahwa sangat penting dan tepat waktu untuk menjelaskan bagaimana orang dewasa dengan pendengaran normal biasanya melakukan tes ini; apa yang membedakan presisi pendengaran yang relatif rendah, normatif, dan tinggi; dan bagaimana pelajar dengan berbagai tingkat presisi pendengaran memperoleh ucapan L2 dari waktu ke waktu.

Studi Saat Ini
Untuk memajukan konsep interaksi bakat-perlakuan dalam lingkungan praktis, penting untuk memberikan panduan konkret bagi para peneliti dan praktisi mengenai kinerja orang dewasa yang khas pada tes pemrosesan pendengaran. Untuk mengontekstualisasikan topik ini, proyek saat ini berfokus pada contoh spesifik pembelajaran bicara L2: pembelajaran prosodi bahasa Inggris oleh pelajar Tiongkok tingkat universitas selama studi di luar negeri. Proyek ini terdiri dari dua studi: Dalam Studi 1, kami meneliti bagaimana 46 mahasiswa Tiongkok dengan profil ketajaman nada yang bervariasi secara alami memperoleh prosodi bahasa Inggris selama 5 bulan studi di luar negeri. Analisis statistik mengungkapkan dua kelompok yang berbeda: mereka yang menunjukkan peningkatan berkelanjutan dan mereka yang membuat kemajuan terbatas. Untuk lebih memahami ambang batas ini, kami memperluas penelitian: Dalam Studi 2, kami mengumpulkan data dari kelompok pelajar L2 yang lebih besar (400 pelajar bahasa Inggris tingkat perguruan tinggi Tiongkok) dan menggunakan serangkaian tes untuk menilai pemrosesan nada. Dengan membandingkan ambang batas yang diidentifikasi dalam Studi 1 dengan hasil korpus dari Studi 2, kami bertujuan untuk memprediksi:

bagaimana profil pemrosesan pendengaran bervariasi di antara orang dewasa dengan pendengaran normal (25% terbawah, normatif, 25% teratas),
sejauh mana peserta didik dapat terus meningkatkan kemampuan L2 mereka dengan praktik (65% teratas), dan
kemungkinan bahwa beberapa pelajar mungkin menunjukkan kemajuan terbatas meskipun menerima jumlah latihan yang sama (35% terbawah).

Kami membedakan pendekatan kami terhadap interaksi bakat-pengobatan dari pandangan psikologi naturalistik, tradisional, dan dominan, yang mengasumsikan keberadaan pengguna bahasa model dan menganggap penyimpangan dari norma ini sebagai defisit. Dalam literatur akuisisi L1 dan pendengaran, ada banyak preseden untuk mendiagnosis peserta dengan tes standar, khususnya dalam menilai gangguan pendengaran domain-umum (lihat Neijenhuis et al., 2019 , untuk tinjauan kritis). Sementara perbedaan biner (ada atau tidaknya gangguan) sering kali ditetapkan berdasarkan sebagian pada analisis deskriptif data korpus (misalnya, 1,5 standar deviasi dari rata-rata populasi; pedoman American Speech-Language-Hearing Association; https://www.asha.org/practice-portal/clinical-topics/articulation-and-phonology/#collapse_5 ), ambang batas ini tidak selalu mencerminkan dampak variabel-variabel ini pada perilaku belajar bahasa.

McMurray et al. ( 2023 ) berpendapat bahwa perbedaan individu harus dilihat bukan dalam hal penyimpangan dari norma, tetapi lebih sebagai kunci untuk memahami fungsi bahasa, menawarkan wawasan yang lebih bernuansa. Dalam tinjauan mereka terhadap literatur pengenalan kata, mereka menyoroti bahwa populasi yang sering diberi label sebagai “penyimpangan”—seperti pengguna implan koklea, anak-anak tuli pralingual, dan remaja dengan gangguan bahasa perkembangan—menggunakan strategi yang berbeda untuk pengenalan kata, dibentuk oleh tantangan sensorik, perkembangan, atau kognitif spesifik mereka (misalnya, pengguna implan koklea cenderung mempertahankan beberapa kandidat dan interpretasi kata yang mungkin lebih lama). Studi ini menunjukkan bahwa perbedaan ini tidak boleh dibingkai sebagai defisit tetapi sebagai solusi alternatif untuk tantangan yang sama dari pemrosesan bahasa waktu nyata. Dengan memeriksa variasi ini, peneliti dapat memperoleh pemahaman yang lebih dalam tentang mekanisme inti yang terlibat dalam pemrosesan bahasa di berbagai populasi.

Contoh lain yang menantang perbedaan biner antara bakat dan mekanisme dasar kompleksnya adalah amusia bawaan. Amusia, sering didefinisikan oleh kinerja dua standar deviasi di bawah rata-rata pada tes memori urutan nada (Peretz et al., 2003 ), dicirikan oleh kesulitan dalam mendeteksi perubahan nada kecil di seluruh rangsangan musikal dan nonmusikal (Hyde & Peretz, 2004 ; Vuvan et al., 2015 ). Meskipun demikian, hanya 7% orang amusic berbahasa Inggris melaporkan masalah dengan persepsi ucapan dalam kehidupan sehari-hari (Liu et al., 2010 ). Ini menyoroti bagaimana pendengar dengan kesulitan persepsi dapat mengimbanginya dengan menggunakan dimensi akustik lain, seperti mengandalkan isyarat durasional untuk persepsi prosodi bahasa Inggris (Jasmin et al., 2020 ).

Hal ini menunjukkan bahwa penggunaan ambang biner yang telah ditentukan sebelumnya, seperti yang digunakan dalam kerangka naturalis, dapat mengabaikan kompleksitas mekanisme pembelajaran bahasa. Sebaliknya, pendekatan kami bersifat reaktif. Pertama-tama kami mengamati bagaimana pembelajaran bahasa berlangsung dalam konteks kehidupan nyata (misalnya, 5 bulan perolehan prosodi oleh 46 pelajar bahasa Inggris Tiongkok). Setelah mengidentifikasi perbedaan dalam perkembangan bahasa dari perspektif longitudinal, kami menilai tingkat pemrosesan pendengaran yang sesuai dengan kemajuan yang terbatas (“presisi pendengaran yang relatif rendah”). Akhirnya, kami memeriksa data korpus dari kelompok yang lebih besar (400 pelajar) untuk memberikan interpretasi deskriptif tentang bagaimana ambang pemrosesan pendengaran ini menjelaskan variasi di seluruh populasi.

Motivasi utama kami dalam menyediakan analisis biner adalah untuk memastikan penerapan praktis penelitian pemrosesan auditori, terutama dalam memandu intervensi. Kami mengikuti gagasan McMurray et al. ( 2023 ) tentang fungsionalisme mekanistik, yang menyatakan bahwa bahasa dan kognisi muncul dari beberapa proses mendasar yang bervariasi antara individu: Variasi ini pada dasarnya tidak lebih baik atau lebih buruk, tetapi hanya cara yang berbeda untuk memecahkan masalah yang sama. Menggemakan McMurray et al., kami menganjurkan pemahaman yang lebih baik tentang perbedaan individu auditori sehingga pelajar dengan presisi auditori yang relatif rendah dapat menerima strategi yang ditargetkan (misalnya, instruksi fonetik, pelatihan auditori) untuk meningkatkan pengalaman pembelajaran bicara L2 naturalistik mereka, karena kombinasi paparan naturalistik dengan pelatihan lanjutan mungkin sangat bermanfaat bagi pelajar ini.

Studi 1: Data Longitudinal
Untuk mengeksplorasi hubungan khusus dimensi antara audisi dan pemerolehan, Studi 1 difokuskan pada peran diskriminasi nada dalam pemerolehan prosodi bahasa Inggris oleh pelajar Tiongkok—seperti tekanan kata dan intonasi—selama 5 bulan belajar di luar negeri di Inggris. Prediksi kami adalah bahwa pemrosesan nada akan secara signifikan memprediksi perkembangan produksi prosodi L2. Di sini, kami bertujuan untuk mengeksplorasi tidak hanya apakah pemrosesan pendengaran berhubungan dengan pembelajaran bicara L2 tetapi juga ambang batas presisi pendengaran yang dibutuhkan untuk meningkatkan pembelajaran bicara L2.

Kemampuan prosodi secara luas diakui sebagai salah satu aspek paling penting dalam mengembangkan tuturan L2 yang mudah dipahami dan dimengerti (Kang et al., 2010 ) dan dianggap sangat menantang bagi pelajar bahasa Inggris Tiongkok (Chrabaszcz et al., 2014 ; J. Zhang et al., 2018 ). Meskipun bahasa Mandarin menggunakan tinggi nada dan kontur untuk menandai setiap suku kata, pelajar bahasa Mandarin mungkin kesulitan dengan perbedaan lintas bahasa dalam prosodi bahasa Inggris, di mana nada digunakan dengan cara yang berbeda untuk menandai suku kata yang ditekankan dan menyampaikan makna pada tingkat kalimat.

Untuk menguji hipotesis kami, kami merekrut pembelajar bahasa Inggris Tiongkok yang cukup berpengalaman (lama tinggal [LOR] > 5 bulan). Peserta ini dianggap telah menyesuaikan diri dengan lingkungan pembelajaran L2 baru mereka setelah beberapa bulan di Inggris. Menurut literatur yang ada, pembelajaran substansial biasanya terjadi dalam 3 hingga 4 bulan pertama perendaman dalam lingkungan berbahasa Inggris, diikuti oleh lintasan pembelajaran yang lebih lambat dan bertahap, yang terkadang mencapai titik puncak (misalnya, Munro & Derwing, 2008 , untuk vokal; Saito & Munro, 2014 , untuk konsonan; Trofimovich & Baker, 2006 , untuk prosodi).

Berdasarkan penyelidikan longitudinal baru-baru ini tentang lintasan pembelajaran bicara L2 melampaui fase awal ini (Munro, Derwing, & Saito, 2024 ), kami mengharapkan tiga karakteristik di antara peserta L2 yang cukup berpengalaman:

Peningkatan yang substansial dan signifikan tidak mungkin diamati pada tingkat kelompok, karena para peserta telah memperoleh manfaat dari fase awal peningkatan yang relatif cepat (Saito & Munro, 2014 ).
Variasi yang cukup besar dalam kinerja linguistik mereka mungkin terjadi, dengan beberapa mengalami perkembangan berkelanjutan sementara yang lain mungkin menunjukkan tingkat yang lebih statis atau bahkan kemunduran karena gangguan L1 yang berkelanjutan (Munro et al., 2024 ).
Performa L2 yang bervariasi tersebut dapat dikaitkan dengan berbagai variabel perbedaan individu, termasuk pengalaman (misalnya, seberapa sering pembelajar menggunakan L2 secara teratur; Flege & Bohn, 2021 ) dan bakat (misalnya, Sun et al., 2021 ).

Dengan berfokus pada pembelajar L2 yang telah melewati fase awal peningkatan pesat (LOR = 5–10 bulan), kami meneliti peran pemrosesan auditori dalam perkembangan bicara L2. Secara khusus, kami mengantisipasi bahwa pembelajar dengan presisi nada yang relatif tinggi akan terus meningkatkan kemahiran prosodi L2 mereka, khususnya ketika mereka sering menggunakan L2, sedangkan mereka yang memiliki presisi nada yang relatif rendah mungkin menunjukkan perkembangan yang terbatas atau bahkan kemunduran. Untuk menetapkan ambang batas untuk membedakan presisi auditori yang tinggi dari yang rendah, kami menerapkan pendekatan statistik post hoc (yaitu, teknik Johnson–Neyman; lihat bagian Hasil di bawah).

Peserta
Sebanyak 46 mahasiswa Tiongkok (3 laki-laki dan 43 perempuan) yang belajar di universitas-universitas di London berpartisipasi dalam penelitian ini. Usia mereka berkisar antara 21 hingga 29 tahun ( M usia = 23,60 tahun, SD = 2,27). Tidak ada peserta yang melaporkan memiliki pengalaman belajar di luar negeri sebelumnya. Awalnya, pada awal proyek, Waktu 1 (T1), durasi tinggal mereka di Inggris adalah 5 bulan. Peserta yang berminat pertama kali diwawancarai tentang pengalaman belajar L2 mereka sebelumnya sebelum belajar di luar negeri dan pengalaman belajar L2 mereka saat ini. Peserta melaporkan sendiri satu persentase penggunaan bahasa Inggris L2 untuk setiap konteks. Yang terakhir merujuk secara khusus pada persentase bahasa Inggris L2 yang digunakan baik di dalam maupun di luar sekolah. Dalam penelitian ini, konsisten dengan temuan sebelumnya (Flege & Bohn, 2021 ), kami berfokus pada sejauh mana peserta menggunakan bahasa Inggris L2 di luar sekolah, karena ukuran ini mencerminkan upaya sukarela mereka untuk terlibat dengan bahasa target dan potensi peningkatan kemahiran berbicara L2.

Selanjutnya, peserta menyelesaikan serangkaian pengujian pemrosesan pendengaran dan L2. Lima bulan kemudian, pada Waktu 2 (T2), peserta kembali untuk mengikuti pengujian pendengaran dan L2 yang sama dan juga melaporkan penggunaan bahasa Inggris L2 mereka selama periode proyek. Sementara sebagian data (data pemahaman) dilaporkan dalam laporan awal kami (Sun et al., 2021 ), makalah saat ini berfokus pada data produksi.

Sebelum proyek, peserta melaporkan telah memiliki pendidikan bahasa asing yang luas ( lama belajar M = 13,40 tahun, SD = 2,02, rentang = 10–19). Menurut skor IELTS yang mereka laporkan sendiri, kemampuan bahasa Inggris umum mereka dapat diklasifikasikan sebagai menengah hingga lanjutan ( x > 6,5). Sebanyak 27 dari 46 peserta melaporkan pelatihan musik (didefinisikan dan dioperasionalkan sebagai lebih dari 6 tahun pelatihan musik; JD Zhang et al., 2020 ). Untuk mensurvei pengalaman pembelajaran L2 peserta saat ini, wawancara individu dilakukan berdasarkan Profil Kontak Bahasa (Freed et al., 2004 ). Seperti yang dirangkum dalam Tabel 3 dan bagian Hasil, penggunaan L1 dan L2 mereka sangat bervariasi pada T1 dan T2.

Pengukuran Pemrosesan Auditori
Dalam studi terkini, dua jenis pemrosesan auditori—ketajaman nada dan forman—dinilai untuk memeriksa hubungan khusus dimensi antara pemrosesan auditori dan pembelajaran ujaran L2. Kami berhipotesis bahwa pembelajaran prosodi L2 partisipan akan dikaitkan dengan pemrosesan nada mereka tetapi tidak dengan pemrosesan forman mereka karena penelitian sebelumnya (Jasmin et al., 2021 ) menunjukkan bahwa pembelajar bahasa Mandarin terutama mengandalkan strategi L1 mereka (memprioritaskan informasi nada) saat mempelajari prosodi bahasa Inggris L2. 1 Untuk menindaklanjuti hubungan khusus dimensi antara diskriminasi forman dan perolehan vokal L2 dalam pelatihan L2 berbasis tugas (mensimulasikan pembelajaran ujaran L2 naturalistik), kami melakukan eksperimen terpisah dengan total 70 pelajar bahasa Inggris sebagai bahasa asing bahasa Mandarin; hasilnya dilaporkan di tempat lain (Xu et al., sedang dicetak ).

Baik ketajaman nada maupun forman diukur melalui dua tugas diskriminasi terpisah menggunakan stimulus nonucapan, format yang banyak digunakan dalam penelitian akuisisi dan pendengaran L1 (Surprenant & Watson, 2001 ). Keandalan uji-uji ulang tugas-tugas ini dianggap “cukup” (ICC = .50–.60; Saito & Tierney, 2024 ). Selain itu, hasil tugas diskriminasi ini terbukti dapat memprediksi berbagai fenomena L2 baik dalam kondisi naturalistik (Saito, Sun et al., 2022 ) maupun pelatihan (Lengeris & Hazan, 2010 ).

Bahan
Sejumlah token yang disintesis disiapkan, dicirikan oleh sifat akustik sederhana (misalnya, kontur frekuensi dasar datar dan bentuk spektral yang tidak berubah), sehingga tidak mungkin dianggap sebagai ucapan manusia. Untuk masing-masing dari dua subtes (forman, nada), stimulusnya identik kecuali untuk dimensi akustik target. Untuk subtes forman, kami membuat 101 nada kompleks, yang terdiri dari satu stimulus standar (Level 0) dan 100 stimulus perbandingan (Level 1 hingga 100). Setiap nada berlangsung selama 500 ms, dengan dua ramp amplitudo linier 5 ms di awal dan akhir. Frekuensi dasar ditetapkan pada 100 Hz, dengan harmonik hingga 3000 Hz. Tiga forman disertakan pada 500 Hz, 1500 Hz, dan 2500 Hz, menggunakan bank filter forman paralel (Smith, 2007 ). Forman kedua (F2) untuk standar ditetapkan pada 1500 Hz, sedangkan untuk nada pembanding berkisar antara 1502 hingga 1700 Hz dengan kelipatan 2 Hz. Untuk subtes nada, 101 nada kompleks empat harmonik disiapkan. Nada-nada ini juga menampilkan tanjakan linier 5 ms di awal dan akhir. Frekuensi dasar stimulus standar ditetapkan pada 330 Hz, dengan nada pembanding berkisar antara 330,3 Hz hingga 360 Hz dalam langkah 0,3 Hz.

Prosedur
Selama setiap percobaan, partisipan mendengarkan tiga stimulus yang disintesis. Stimulus kedua selalu konstan, sedangkan stimulus pertama atau terakhir bervariasi. Partisipan harus mengidentifikasi suara yang berbeda dengan menekan “1” atau “3” pada layar komputer, yang sesuai dengan apakah stimulus pertama atau ketiga adalah yang ganjil. Untuk efisiensi waktu, prosedur ambang batas adaptif Levitt ( 1971 ) digunakan untuk menyesuaikan perbedaan antara stimulus berdasarkan kinerja partisipan. Pengujian dimulai pada titik tengah stimulus perbandingan (Level 50 dari 100), dengan ukuran langkah awal 10. Jika seorang partisipan merespons dengan tidak benar, kesulitan tugas dikurangi dengan meningkatkan perbedaan stimulus sebanyak 10 langkah. Sebaliknya, jika seorang partisipan memberikan tiga respons yang benar berturut-turut, kesulitannya ditingkatkan dengan mengurangi perbedaan stimulus sebanyak 10 langkah. Ukuran perubahan kesulitan di seluruh percobaan menurun setelah setiap “pembalikan,” yang didefinisikan sebagai respons yang benar diikuti oleh respons yang salah atau respons yang salah diikuti oleh respons yang benar. Setelah pembalikan pertama, ukuran langkah dikurangi dari 10 menjadi 5, dan setelah pembalikan kedua dari 5 menjadi 1. Pengujian berakhir setelah 70 kali percobaan atau delapan pembalikan. Kemampuan pemrosesan pendengaran peserta diukur dengan menghitung rata-rata tujuh poin pembalikan terakhir, dengan skor yang lebih rendah menunjukkan ketajaman persepsi yang lebih besar, yang berarti peserta dapat membedakan perbedaan yang lebih kecil antara stimulus standar dan pembanding.

Semua tes pemrosesan pendengaran tersedia di L2 Speech Tools (Mora-Plaza et al., 2022 ). Untuk manual tes dan hasil reliabilitas, lihat Saito dan Tierney ( 2024 ).

Pengukuran Produksi Ucapan L2
Meskipun aspek prosodi dari kemahiran berbicara L2 telah diperiksa secara ekstensif, temuan sebagian besar didasarkan pada tugas produksi terkendali (misalnya, tugas pengulangan tertunda; Trofimovich & Baker, 2006 ). Telah dilaporkan bahwa pembelajar L2 dewasa dapat memantau dan mengoreksi produksi mereka ketika mereka dapat berkonsentrasi penuh pada tugas, namun kinerja tersebut mungkin tidak secara akurat mencerminkan kemahiran L2 mereka dalam situasi kehidupan nyata, di mana mereka harus menggunakan prosodi L2 secara akurat dan lancar sambil secara bersamaan memperhatikan berbagai aspek bahasa (misalnya, kosa kata dan tata bahasa; Major, 2001 ). Untuk memperoleh ucapan L2 spontan peserta, dua versi narasi gambar yang berbeda dari Ujian Bahasa Inggris EIKEN (Versi A dan B; lihat Lampiran S1 dalam Informasi Pendukung daring) digunakan. Mereka diseimbangkan untuk menghindari efek uji-uji ulang, dengan separuh peserta pertama terlibat dalam Versi A → B dan separuh lainnya dalam B → A. Sebanyak 92 narasi gambar (46 peserta × T1/T2) diserahkan ke analisis penilai.

Bahasa Indonesia: Mengikuti prosedur yang ditetapkan oleh Saito et al. ( 2017 ), rentang 30 detik pertama dari setiap sampel ucapan peserta—setelah menghilangkan awal yang salah dan keheningan—dinormalisasi dengan mencocokkan amplitudo puncak di seluruh sampel dan menghilangkan ketidaklancaran awal (misalnya, awal yang salah, jeda). Untuk menilai sampel ucapan, kami merekrut lima penutur asli Bahasa Inggris British yang memiliki pengalaman luas (> 10 tahun) dalam mengajar berbagai pelajar L2 dan yang memegang gelar Master of Arts dalam Pengajaran Bahasa Inggris kepada Penutur Bahasa Lain (TESOL), yang memenuhi syarat mereka sebagai “penilai ahli.” Sesi penilaian dilakukan secara individual tatap muka (bersama-sama dengan asisten peneliti terlatih).

Para penilai pertama-tama menerima penjelasan terperinci tentang tekanan kata bahasa Inggris, intonasi, dan kesalahan L2 yang umum (misalnya, salah penempatan dan tidak adanya tekanan/intonasi; lihat Tabel 1 ). Mereka kemudian mendengarkan lima contoh praktik bicara L2 (tidak termasuk dalam sesi penilaian utama) untuk membiasakan diri dengan prosedur penilaian. Mereka menilai masing-masing contoh suara ini berdasarkan kualitas tekanan kata bahasa Inggris dan intonasi menggunakan penggeser bergerak di layar komputer. Untuk setiap penilaian, para penilai juga membenarkan penilaian mereka dengan lantang. Atas dasar ini, asisten terlatih berusaha mengidentifikasi apakah para penilai memiliki kesalahpahaman tentang rubrik (misalnya, kebingungan antara tekanan kata vs. intonasi atau dimensi lain dari pengucapan L2). Dikonfirmasi bahwa semua penilai memahami dengan jelas dan menerapkan kedua rubrik: tekanan kata dan intonasi. Kualitas pengucapan setiap contoh dicatat pada skala 1.000 poin, dengan setiap ujung kontinum ditandai dengan ikon yang mewakili sangat baik (wajah tersenyum) dan buruk (wajah cemberut). Untuk label di layar, lihat Gambar 1 .

Tabel 1. Naskah pelatihan prosodi bahasa Inggris (tekanan kata, intonasi)

Tekanan kata

Bila sebuah kata dalam bahasa Inggris memiliki lebih dari satu suku kata, salah satu suku kata akan sedikit lebih keras dan lebih panjang daripada suku kata lainnya. Misalnya, jika Anda mengucapkan kata “computer”, Anda mungkin memperhatikan bahwa suku kata kedua memiliki tekanan yang lebih besar (comPUter). Jika Anda mendengar tekanan ditempatkan pada suku kata yang salah, atau Anda mendengar tekanan yang sama pada semua suku kata dalam sebuah kata, maka ada kesalahan tekanan kata.

Intonasi

Intonasi dapat dianggap sebagai melodi bahasa Inggris. Intonasi adalah perubahan nada alami yang terjadi saat kita berbicara. Misalnya, Anda mungkin memperhatikan bahwa saat mengajukan pertanyaan dengan jawaban ya/tidak, nada bicara Anda naik di akhir pertanyaan. Jika seseorang terdengar “datar” saat berbicara, kemungkinan besar karena intonasinya tidak mengikuti pola intonasi bahasa Inggris.

GAMBAR 1 — Label di layar untuk menilai prosodi bahasa Inggris. Penilai menilai kualitas tekanan dan intonasi secara terpisah, menggunakan penggeser bergerak setelah mendengar setiap contoh. Penilaian berkisar dari 0 ( buruk ) hingga 1.000 ( sangat baik ).

Setelah merasa nyaman, para penilai melanjutkan untuk menilai set data utama dalam sesi yang berlangsung sekitar 1,5 jam, dengan sampel ucapan diputar dalam urutan acak. Setelah mengevaluasi separuh pertama sampel ( n = 46), para penilai beristirahat selama 5 menit. Sepanjang sesi, para penilai dapat berkonsultasi dengan asisten jika mereka memiliki pertanyaan atau kebingungan, meskipun tidak ada masalah seperti itu yang muncul selama sesi pelatihan. Mirip dengan para penilai dalam studi sebelumnya (Saito et al., 2017 ), lima penilai dari studi saat ini menunjukkan tingkat persetujuan yang relatif tinggi (alfa Cronbach = .93 untuk tekanan kata dan .90 untuk intonasi). Untuk setiap pembicara, skor para penilai dirata-ratakan di seluruh dimensi (tekanan kata, intonasi) pada T1 dan T2, masing-masing. Skor ini (dirangkum dalam Tabel 3 ) kemudian dikenakan analisis regresi efek campuran (untuk detailnya, lihat bagian Hasil).

Hasil
Semua set data relevan tersedia melalui Open Science Framework ( http://doi.org/10.17605/OSF.IO/9UAN8 ). Skor pemrosesan pendengaran partisipan untuk diskriminasi pitch dan forman dirangkum dalam Tabel 2 dan disajikan secara visual dalam Gambar 2 . Hasil uji Kolmogorov–Smirnov mengungkapkan bahwa kedua skor diskriminasi condong positif (diskriminasi pitch: D = .237, p = .009; diskriminasi forman: D = .200, p = .043). Banyak partisipan menunjukkan pemrosesan pendengaran yang sangat tepat dalam diskriminasi pitch ( M = 13,76) dibandingkan dengan diskriminasi forman ( M = 24,67). Hasil ini tidak mengejutkan, mengingat partisipan adalah pengguna bahasa tonal (L1 Mandarin). Menariknya, analisis korelasi Spearman menunjukkan bahwa korelasi antara skor tes diskriminasi nada dan forman tidak mencapai signifikansi statistik ( r = .210, p = .160), yang menunjukkan bahwa kedua tes diskriminasi tersebut menilai dimensi yang berbeda dari pemrosesan pendengaran (pemrosesan nada vs. forman).

Tabel 2. Ringkasan deskriptif hasil tes pemrosesan pendengaran untuk Studi 1

Tes	M	SD	IQR	Q1	Q2	Q3	Q4
Diskriminasi nada	13.76	Jam 09.30	7.59	Jam 3.00–8.00	08.00–10.83	Pukul 11.00–15.50	15.71–45.00
Diskriminasi forman	24.67	18.63	30.26	Jam 3.00–8.00	09.00–17.29	20.00–37.71	39,75–67,33

Catatan . Skor yang lebih rendah menunjukkan pemrosesan pendengaran yang lebih tepat. IQR = rentang interkuartil; Q = kuartil.

GAMBAR 2 — Distribusi dua jenis skor pemrosesan auditori di antara 46 pelajar bahasa Inggris Tiongkok di Inggris. Skor pemrosesan nada peserta umumnya lebih rendah, yang menunjukkan presisi yang lebih tinggi, dibandingkan dengan skor pemrosesan forman mereka.

Seperti yang ditunjukkan pada Tabel 3 , statistik deskriptif tentang kemahiran prosodi L2 peserta menunjukkan sedikit perubahan dalam kinerja mereka antara T1 dan T2. Hasil yang relatif stabil dapat dikaitkan tidak hanya dengan durasi proyek yang singkat (5 bulan belajar di luar negeri) tetapi juga dengan perbedaan individu yang signifikan pada peserta dalam penggunaan L2 baik di dalam maupun di luar lingkungan sekolah, serta dalam kemampuan pemrosesan pendengaran.

Tabel 3. Statistik deskriptif tentang kemahiran prosodi L2, penggunaan L2, dan pemrosesan auditori peserta

Ciri	M	SD	95% CI	Jangkauan	D ^sebuah	P	M	SD	95% CI	Jangkauan	D ^sebuah	P
	T1						T2
Kemampuan prosodi L2
Tekanan kata ^b	595	125	[557, 632]	328–854	.183	.090	587	134	[547, 627]	365–867	.181	.097
Intonasi ^b	476	148	[432, 520]	275–895	.179	.104	478	151	[433, 523]	227–849	.176	.115
Penggunaan L2
L2 di luar sekolah (%)	29.9	17.7	[24.6, 35.1]	2,50–80,00	.174	.121	28.1	20.1	[22.1, 34.1]	2,50–95,00	.173	.127
Pemrosesan pendengaran
Diskriminasi nada	13.4	Tanggal 9.07	[11.0, 16.5]	3.00–45.00	.152	.237
Diskriminasi forman	21.5	14.0	[16.8, 25.3]	4.43–63.25	.158	.200

Catatan . T1 = Waktu 1; T2 = Waktu 2. a Nilai untuk uji normalitas Kolmogorov–Smirnov. b 1.000 poin.

Tujuan pertama dari analisis statistik inferensial adalah untuk memeriksa bagaimana performa partisipan berubah selama 5 bulan studi di luar negeri di Inggris terkait dengan profil pemrosesan auditori (diskriminasi nada) mereka yang berbeda bahkan ketika penggunaan L2 mereka diperhitungkan. Untuk tujuan ini, serangkaian analisis regresi efek campuran dilakukan menggunakan lingkungan statistik R (Versi 4.3.1; Tim Inti R, 2023 ). Untuk membangun model (Model 1–4; lihat di bawah), paket lme4 diadopsi (Bates et al., 2023 ). Dalam model ini, skor prosodi L2 partisipan digunakan sebagai variabel dependen. Variabel prediktor meliputi waktu (T1, T2), dimensi prosodi (tekanan kata, intonasi), pemrosesan nada (skor diskriminasi nada), L2 di dalam (T1, T2), dan L2 di luar (T1, T2). (“L2 di dalam” dan “L2 di luar” merujuk pada penggunaan L2 di dalam dan di luar sekolah.)

Dalam Model 1 (DV ∼ time*dimension*pitch_processing + (1|ID)), kami bertujuan untuk memeriksa bagaimana performa prosodi partisipan berubah seiring waktu dalam kaitannya dengan skor pemrosesan auditori berkelanjutan mereka. Seperti yang ditunjukkan dalam Tabel 4 , efek utama dari waktu dan pemrosesan auditori mencapai signifikansi statistik ( masing-masing p = .019, .025), yang menunjukkan bahwa 5 bulan studi di luar negeri memang memengaruhi performa partisipan dan bahwa mereka dengan pemrosesan nada yang lebih tepat menunjukkan prosodi Bahasa Inggris L2 yang lebih mirip target. Yang penting, efek interaksi dari waktu dan pemrosesan auditori signifikan ( p = .002). Pertama, menggunakan emtrends dalam paket emmeans (Versi 1.10.7; Lenth, 2025 ), kami melakukan analisis kemiringan sederhana untuk mengeksplorasi bagaimana efek pemrosesan auditori pada kemahiran prosodi L2 berubah seiring waktu. Untuk T1, kemiringan ambang nada adalah -0,00266 ( SE = 0,002), dengan interval kepercayaan berkisar dari -0,00667 hingga 0,00134, yang menunjukkan efek yang tidak signifikan. Pada T2, kemiringannya adalah -0,00619 ( SE = 0,002), dengan interval kepercayaan dari -0,01020 hingga -0,00219, yang menunjukkan efek negatif signifikan dari ambang nada pada variabel dependen (DV). Ini menunjukkan pengaruh ambang nada yang lebih kuat dan signifikan secara statistik pada T2, yang menunjukkan bahwa partisipan dengan pemrosesan pendengaran yang lebih tepat mencapai kemahiran prosodi L2 yang lebih maju selama periode ini (untuk ringkasan visual, lihat Gambar 3 ).

Tabel 4. Ringkasan Model 1

Efek tetap	F	P	saya _p²	R ²_bersyarat	R ²_marjinal
Dimensi	46.982	< .001	.26	.779	.225
Waktu	5.631	.019	.04
Pemrosesan nada	5.363	.025	.11
Dimensi × Waktu	0,399 tahun	.528	< .01
Dimensi × Pemrosesan Pitch	1.130	.289	< .01
Waktu × Pemrosesan Pitch	9.405	.002	.07
Dimensi × Waktu × Pemrosesan Pitch	1.091	.298	< .001

Catatan . Rumus model: DV ∼ waktu*dimensi*pitch_processing + (1|ID).

GAMBAR 3 — Plot visual yang menggambarkan hubungan antara kemahiran prosodi L2 dan pemrosesan auditori di awal (T1, panel kiri) dan akhir (T2, panel kanan) proyek. Produksi tekanan kata diwakili oleh titik-titik hijau dan produksi intonasi oleh titik-titik kuning. Garis-garis tersebut mewakili garis tren linier, dengan daerah yang diarsir menunjukkan interval kepercayaan 95%. Skor kemahiran prosodi yang lebih tinggi menunjukkan kemahiran yang lebih maju, sementara skor pemrosesan auditori yang lebih rendah menandakan diskriminasi nada yang lebih tepat. Pada T1, peran pemrosesan auditori dalam kemahiran prosodi L2 tetap tidak signifikan. Pada T2, peserta dengan pemrosesan auditori yang lebih tepat menunjukkan kemahiran prosodi L2 yang jauh lebih maju.

Untuk memeriksa lebih lanjut efek interaksi waktu dan pemrosesan pendengaran, analisis post hoc dilakukan untuk menentukan tingkat presisi pendengaran yang diperlukan bagi peserta untuk menunjukkan peningkatan yang signifikan dari waktu ke waktu. Untuk tujuan ini, kami menerapkan teknik Johnson–Neyman menggunakan paket interaksi. Teknik ini mengidentifikasi wilayah di mana nilai yang diharapkan dari variabel kriteria untuk dua kelompok berbeda secara signifikan, berdasarkan satu atau lebih variabel prediktor (Potthoff, 1964 ). Pendekatan ini memungkinkan analisis statistik untuk menentukan skor pemrosesan pendengaran di mana peserta dapat dikategorikan sebagai peningkatan atau kemunduran, daripada bergantung pada indeks yang telah ditentukan sebelumnya.

Seperti yang ditunjukkan pada Gambar 4 , ambang batas nada 14 ditetapkan sebagai titik batas: Efek waktu sederhana signifikan ( p < .05) ketika skor pemrosesan nada peserta di atas 14 (dari 100). Namun, efek waktu menjadi tidak signifikan ketika skor pemrosesan nada mereka di bawah 14. Mengingat bahwa skor pemrosesan pendengaran yang lebih tinggi menunjukkan presisi pendengaran yang lebih rendah, temuan ini menunjukkan bahwa ketika presisi pendengaran peserta kurang akurat daripada ambang batas (14 dari 100), pemrosesan pendengaran mulai berdampak negatif pada perkembangan prosodi L2 mereka. 2

Untuk menindaklanjuti lebih lanjut sifat efek interaksi (efek signifikan di antara mereka yang berada di luar ambang batas nada 14 dari 100 poin), kami membagi 46 peserta ke dalam kategori kelompok post hoc berdasarkan ambang batas mereka: x < 14 untuk kelompok normatif ( n = 33) dan x < 14 untuk kelompok presisi rendah ( n = 13). Model 2 (DV ∼ waktu*dimensi*kelompok + (1|ID)) dibangun untuk menentukan bagaimana setiap kelompok (normatif vs. presisi rendah) mengubah kemahiran prosodi L2 mereka dari waktu ke waktu.

Seperti yang ditunjukkan pada Tabel 5 , efek interaksi antara waktu dan kelompok mencapai signifikansi statistik ( p = .017). Kami melakukan serangkaian analisis perbandingan berganda post hoc menggunakan paket emmeans. Seperti yang diringkas secara visual pada Gambar 5 , perbandingan berpasangan yang disesuaikan untuk pengujian berganda menggunakan metode Tukey tidak mengungkapkan perbedaan signifikan antara T1 dan T2 untuk kelompok presisi pendengaran normatif ( b = −0,012, SE = 0,012, t = −1,012, p = .313). Namun, pada kelompok presisi pendengaran yang lebih rendah, penurunan signifikan dalam kemahiran diamati dari T1 ke T2 ( b = 0,044, SE = 0,012, t = 2,201, p = .0029). Temuan ini menunjukkan bahwa sementara tidak ada peningkatan yang jelas dalam kemahiran prosodi L2 peserta dari waktu ke waktu, kemahiran mereka yang memiliki presisi pendengaran yang lebih rendah menjadi kurang seperti target.

Tabel 5. Ringkasan Model 2

Efek tetap	F	P	saya _p²	R ²_bersyarat	R ²_marjinal
Dimensi	Nomor telepon 99.3055	< .001	.43	.773	.192
Waktu	1.7593	.187	.01
Kelompok	3.0576	.087	.06
Dimensi × Waktu	0.7544	.386	< .01
Dimensi × Grup	0.9142	.340	< .01
Waktu × Grup	5.7688	.017	.04
Dimensi × Waktu × Grup	1.2691	.261	< .01

Catatan . Rumus model: DV ∼ waktu * dimensi * grup + (1|ID).

GAMBAR 5 — Perubahan rata-rata kelompok dan interval kepercayaan 95% untuk kemahiran prosodi L2 dari waktu ke waktu (T1 vs. T2), membandingkan kelompok presisi pendengaran normatif (merah) dan kelompok presisi pendengaran rendah (biru). Kemahiran prosodi dalam kelompok presisi normatif tetap konsisten dari waktu ke waktu; namun, ada penurunan signifikan dalam kemahiran di antara mereka yang memiliki presisi pendengaran rendah, yang menghasilkan skor yang jauh lebih rendah daripada skor kelompok normatif di akhir proyek (T2).

Dalam hal perbedaan kelompok pada T1 dan T2, serangkaian analisis post hoc lainnya menunjukkan bahwa perbedaan dalam kemahiran prosodi L2 antara kelompok presisi pendengaran normatif dan rendah adalah kecil dan tidak signifikan secara statistik pada T1 ( b = 0,041, SE = 0,041, t = 0,990, p = .326). Namun, pada T2, perbedaan yang signifikan secara statistik diamati antara kelompok yang sama, di mana kelompok dengan presisi pendengaran yang lebih rendah menunjukkan kemahiran prosodi L2 yang kurang maju relatif terhadap kelompok normatif ( b = 0,098, SE = 0,041, t = 2,362, p = .022). Hasilnya menunjukkan bahwa efek pemrosesan pendengaran dalam pembelajaran bicara L2 sebagian besar dapat dikaitkan dengan mereka yang memiliki presisi pendengaran yang relatif rendah, karena pola pembelajaran mereka tampak terbatas dan dapat dicirikan sebagai regresi meskipun ada kesempatan masukan intensif selama belajar di luar negeri. Lihat Gambar 5 untuk ringkasan kelompok post hoc (normatif vs. rendah) dan Gambar 6 untuk lintasan pembelajar individu dalam setiap kategori kelompok post hoc.

GAMBAR 6 — Perubahan dari waktu ke waktu (T1 vs. T2) dalam kinerja prosodi L2 masing-masing peserta, diplot berdasarkan fitur prosodi (tekanan kata, intonasi) dan kelompok (presisi normatif, presisi rendah). Variasi individu yang signifikan diamati dalam kelompok presisi normatif, sedangkan tren penurunan kinerja secara umum menjadi ciri kelompok presisi rendah.

Sementara mayoritas peserta dengan presisi pendengaran yang relatif rendah ( x > 14) menunjukkan regresi, kemahiran prosodi L2 kelompok normatif ( x < 14) tidak menunjukkan perubahan signifikan dari waktu ke waktu. Analisis lanjutan dilakukan untuk memeriksa apakah variabel tertentu terkait dengan peningkatan dari waktu ke waktu dalam individu dalam kelompok presisi normatif ( n = 33). Mengingat ukuran sampel yang relatif kecil, temuan selanjutnya harus dianggap tentatif.

Model 3 ( kelompok normatif DV ∼ waktu*dimensi*penggunaan_L2 + (1|ID)) dibangun untuk memeriksa efek interaksi kompleks dari waktu, penggunaan L2, dan pemrosesan auditori di kedua dimensi kemahiran prosodi L2 (tekanan kata, intonasi). Penggunaan L2 dihitung berdasarkan persentase waktu di mana peserta menggunakan Bahasa Inggris L2 (relatif terhadap Bahasa Mandarin L1) di luar sekolah pada awal dan akhir proyek ( M = 28,3%, SD = 18,8%, rentang = 2,5–95%). Seperti yang dirangkum dalam Tabel 6 , efek interaksi penggunaan L2 dan waktu mencapai signifikansi statistik, F = 5,613, p = 0,019 . Hal ini menunjukkan bahwa daya prediktif pemrosesan auditori untuk perkembangan prosodi L2 di antara mereka yang memiliki profil pemrosesan auditori normatif mungkin bergantung pada profil pengalaman mereka.

Tabel 6. Ringkasan Model 3

Efek tetap	F	P	saya _p²	R ²_bersyarat	R ²_marjinal
Penggunaan L2	5.328	.022	.04	.770	.104
Waktu	6.310	.013	.06
Dimensi	35.618	< .001	.28
L2 Penggunaan × Waktu	5.613	.019	.05
L2 Penggunaan × Dimensi	3.278	.073	.03
Waktu × Dimensi	0.606	.438	< .01
L2 Penggunaan × Dimensi	1.202	.275	.01

Catatan . Rumus model: Grup normatif DV ∼ waktu*dimensi*penggunaan L2 + (1|ID).

Untuk analisis post hoc, peserta dibagi menjadi dua subkategori. Pertama, kami mengkategorikan mereka menjadi pengguna reguler versus pengguna nonreguler, menggunakan median split untuk penggunaan L2 (23,75%). Menghitung dan menganalisis estimasi mean marginal (melalui paket emmeans), beberapa analisis perbandingan menunjukkan bahwa pengguna reguler dengan presisi pendengaran normatif secara signifikan meningkatkan kemahiran mereka dari waktu ke waktu, dari M = 0,525 menjadi M = 0,584; b = −0,059, SE = 0,023, t = −2,498, p = 0,014 (disesuaikan Bonferroni). Namun, pembelajaran signifikan tersebut tidak diamati dalam konteks kelompok lain. Hasilnya menunjukkan bahwa sebagian kecil peserta dengan pemrosesan pendengaran yang baik dan penggunaan L2 yang tinggi menunjukkan peningkatan. Intinya, presisi pendengaran normatif saja mungkin tidak menjamin perkembangan berkelanjutan; namun, hal itu dapat secara positif memengaruhi kemahiran bicara L2, asalkan pelajar secara teratur menggunakan bahasa target.

Sementara analisis yang disajikan sejauh ini telah mendukung hubungan khusus dimensi antara pemrosesan auditori dan pembelajaran pengucapan L2 (yaitu, skor diskriminasi nada secara signifikan memprediksi perkembangan prosodi Bahasa Inggris L2 peserta), tujuan akhir kami adalah untuk memeriksa peran yang mungkin tidak signifikan dari pemrosesan auditori peserta dalam dimensi lain (skor diskriminasi forman) dalam pembelajaran prosodi L2. Untuk tujuan ini, Model 4 (DV ∼ waktu*dimensi*formant_processing + (1|ID)) dibangun. Seperti yang dirangkum dalam Tabel 7 , hasil dari analisis pemodelan efek campuran tidak mengungkapkan efek utama atau interaksi yang signifikan dari waktu dan pemrosesan auditori ( p > .05) ketika skor diskriminasi forman dimasukkan sebagai variabel kelompok. Temuan ini mengonfirmasi prediksi kami bahwa pemrosesan auditori memengaruhi pembelajaran bicara L2 pada tingkat khusus dimensi, dengan skor diskriminasi nada tetapi bukan forman yang menjadi prediktif pembelajaran prosodi L2.

Tabel 7. Ringkasan Model 4

Efek tetap	F	P	saya _p²	R ²_bersyarat	R ²_marjinal
Dimensi	30.549	< .001	.19	.764	.167
Waktu	1.046	.308	< .01
Pengolahan forman	1.746	.193	.04
Dimensi × Waktu	0,080	.776	< .01
Dimensi × Pemrosesan Forman	0.113	.736	< .01
Waktu × Pemrosesan Forman	2.075	.152	.02
Dimensi × Waktu × Pemrosesan Forman	0,004 tahun	.948	< .001

Catatan . Ringkasan model: DV ∼ waktu*dimensi*formant_processing + (1|ID).

Studi 2: Data Korpus
Dalam konteks perolehan prosodi bahasa Inggris oleh pelajar Tiongkok selama 5 bulan belajar di luar negeri, Studi 1 mengonfirmasi bukti yang muncul yang menunjukkan hubungan antara ketepatan pendengaran dan pembelajaran bicara L2 (Mueller et al., 2012 ). Secara khusus, hasil kami selaras dengan temuan sebelumnya bahwa efek pemrosesan pendengaran sangat menonjol di antara individu dengan ketepatan pendengaran yang lebih rendah, terutama ketika pelajar ini dihadapkan pada lingkungan belajar yang nyata, naturalistis, dan menantang (Chandrasekaran et al., 2010 ; Correia et al., in press ; Perrachione et al., 2011 ; Ruan & Saito, 2023 ; Xu et al., in press ; W. Zhang et al., 2024 ). Temuan menunjukkan ambang batas 14 dari 100 pada tugas diskriminasi nada: Mereka yang tidak dapat mendeteksi perbedaan yang lebih kecil dari 4,2 Hz dalam frekuensi dasar menunjukkan kemajuan pembelajaran yang sangat terbatas. Berdasarkan data tersebut, kami secara tentatif menyimpulkan bahwa sekitar seperempat populasi (28,2%; 13 dari 46 peserta) mungkin termasuk dalam kategori presisi pendengaran yang relatif rendah, yang dapat berdampak negatif pada area relevan pemerolehan ujaran L2, khususnya prosodi bahasa Inggris.

Untuk mendapatkan gambaran yang tepat tentang berapa banyak individu yang berada di bawah ambang batas yang diukur dalam Studi 1, kami merancang Studi 2 untuk merekrut sampel peserta yang lebih besar dengan latar belakang yang sama (400 pelajar bahasa Inggris tingkat universitas asal Tiongkok). Peserta ini diminta untuk mengikuti tes diskriminasi nada yang sama (bersama dengan tes pemrosesan pendengaran lainnya). Secara khusus, Studi 2 bertujuan untuk menentukan berapa proporsi pelajar yang akan berada di atas atau di bawah skor 14 dari 100 (yaitu, perbedaan frekuensi dasar 4,2 Hz) dalam korpus data pemrosesan pendengaran yang lebih luas di antara pelajar bahasa Inggris asal Tiongkok.

Peserta
Bahasa Indonesia: Untuk mewakili individu dewasa dengan berbagai tingkat kemahiran dan memperhitungkan pengaruh latar belakang L1 mereka, kami awalnya merekrut 400 pelajar bahasa Mandarin Tiongkok yang belajar bahasa Inggris di Tiongkok dan Inggris. Untuk mewakili rentang usia potensial mahasiswa tingkat universitas dan mencocokkan rentang partisipan dalam Studi 1 ( M = 23,60, SD = 2,27, rentang = 21–29), kami berfokus pada pelajar dalam rentang usia yang sempit: 18 hingga 32 tahun. Untuk memaksimalkan ukuran sampel, kami memanfaatkan pembangun eksperimen psikologi daring, Gorilla (Anwyl-Irvine et al., 2020 ). Kami menerapkan prosedur, yang ditetapkan dalam penelitian kami sebelumnya (Saito & Tierney, 2024 ), untuk memastikan kualitas data yang homogen yang dikumpulkan melalui platform daring, sebanding dengan kondisi tatap muka. Dari total partisipan, 95 berasal dari studi tim kami yang diterbitkan sebelumnya (Saito et al., 2024 ). Peserta yang tersisa membentuk kumpulan data gabungan dari tujuh proyek disertasi magister yang tidak dipublikasikan, yang menyelidiki profil pemrosesan pendengaran pelajar bahasa Inggris Tiongkok dan hubungannya dengan berbagai jenis kemahiran berbicara L2 naturalistik dan terinstruksikan.

Sementara peserta dalam setiap proyek menjalani kombinasi uji pemrosesan pendengaran yang sedikit berbeda (misalnya, diskriminasi nada, forman, durasi, dan waktu kenaikan amplitudo; reproduksi melodi dan ritme), semua 400 peserta menyelesaikan uji diskriminasi nada dan forman. Dalam makalah ini, kami melaporkan hasil uji diskriminasi nada dan forman ini, sementara itu terus mengumpulkan dan mengembangkan set data yang cukup besar untuk hasil uji pemrosesan pendengaran lainnya guna menginformasikan analisis di masa mendatang.

Usia peserta berkisar antara 18 hingga 32 tahun ( M = 24,8, SD = 2,8). Mereka telah menerima periode pendidikan Bahasa Inggris sebagai Bahasa Asing yang ekstensif di Tiongkok ( M = 13,5 tahun, SD = 3,8, rentang = 5–24). Dari peserta ini, 167 tidak memiliki pengalaman di luar negeri, sementara 333 melaporkan berbagai lama pengalaman pencelupan di Inggris ( M = 1,6 tahun, SD = 2,9, rentang = 0,4–11), dengan waktu kedatangan yang berbeda ( M = 21,3 tahun, SD = 3,6, rentang = 15–32). Selain itu, 154 peserta melaporkan memiliki pelatihan musik, dengan durasi yang sangat bervariasi ( M = 4,8 tahun, SD = 4,6, rentang = 0,5–23). Semua peserta melaporkan pendengaran normal.

Hasil
Semua set data relevan tersedia melalui Open Science Framework ( http://doi.org/10.17605/OSF.IO/9UAN8 ). Dalam penyelidikan saat ini, tujuan utama kami adalah untuk menentukan berbagai tingkat kemampuan pemrosesan pendengaran (kuartil pertama, kedua, ketiga, dan keempat) di antara total 400 pelajar bahasa Inggris tingkat perguruan tinggi Tiongkok dengan pendengaran normal. Statistik deskriptif skor pemrosesan pendengaran peserta dirangkum dalam Tabel 8 dan direpresentasikan secara visual dalam Gambar 7 . Hasil uji normalitas Kolmogorov–Smirnov menunjukkan bahwa skor diskriminasi pitch dan forman menyimpang secara signifikan dari distribusi normal (diskriminasi pitch: D = .208, p < .001; diskriminasi forman: D = .076, p < .001). Mirip dengan Studi 1, peserta menunjukkan skor yang jauh lebih rendah, yang menunjukkan pemrosesan pendengaran yang lebih tepat, untuk informasi nada ( M = 14,70, rentang interkuartil [IQR] = 11,37) dibandingkan dengan informasi forman ( M = 31,64, IQR = 27,54). Namun, analisis korelasi Spearman mengungkapkan korelasi yang signifikan secara statistik antara skor diskriminasi nada dan forman ( r = 0,378, p <0,001).

Tabel 8. Ringkasan deskriptif hasil tes pemrosesan pendengaran untuk Studi 2

Tes	M	SD	IQR	Q1	Q2	Q3	Q4
Diskriminasi nada	14.70	11.25	11.37	2.33–6.66	6.80–11.00	11.16–17.91	18.16–97.75
Diskriminasi forman	31.64	pukul 17.15	27.54	2.33–16.33	16.66–30.00	30,50–43,83	44,00–85,83

Catatan . Skor yang lebih rendah menunjukkan pemrosesan pendengaran yang lebih tepat. IQR = rentang interkuartil; Q = kuartil.

GAMBAR 7 — Distribusi dua jenis skor pemrosesan auditori di antara total 400 pelajar bahasa Inggris tingkat perguruan tinggi Tiongkok dalam Studi 2. Dalam pola yang sama dengan Studi 1, skor pemrosesan nada peserta secara umum lebih rendah, yang menunjukkan presisi yang lebih tinggi, dibandingkan dengan skor pemrosesan forman mereka.

Analisis interkuartil dilakukan untuk menentukan posisi relatif ambang batas yang diidentifikasi dalam Studi 1 (skor pemrosesan nada = 14 dari 100) dalam set data yang lebih besar ( n = 400 pelajar bahasa Inggris tingkat perguruan tinggi Tiongkok). Hasilnya menunjukkan bahwa ambang batas diskriminasi nada dari Studi 1 ( x = 14,00) jatuh ke kuartil ketiga (11,16 < x < 17,91). Berdasarkan data mentah, 259 peserta mendapat skor di bawah 14 (menunjukkan pemrosesan nada yang lebih tepat; rentang = 2,33–13,83), sementara 141 peserta mendapat skor di atas 14 (menunjukkan pemrosesan nada yang kurang tepat; rentang = 14,00–97,75), yang menunjukkan bahwa sekitar 35,2% populasi memiliki presisi pendengaran yang lebih rendah. Menariknya, rasio yang disarankan dalam Studi 2 (35,2%) sedikit lebih tinggi daripada rasio dalam Studi 1 (28,2%). Diskusi Bukti yang muncul menunjukkan bahwa presisi pendengaran umum domain berdampak signifikan pada laju pembelajaran ujaran L2 naturalistik. Khususnya, individu yang menunjukkan presisi pendengaran yang lebih rendah tampaknya membuat kemajuan dan kemunduran yang terbatas, bahkan ketika menerima peluang masukan yang sama dengan mereka yang memiliki kemampuan pemrosesan pendengaran normatif (misalnya, Perrachione et al., 2011 ). Temuan ini penting, karena pelajar dengan presisi pendengaran yang relatif rendah mungkin memerlukan strategi perbaikan untuk mendapatkan manfaat penuh dari setiap peluang pembelajaran, terlepas dari profil bakat mereka. Baru-baru ini, tes pemrosesan pendengaran telah tersedia untuk umum bagi para peneliti dan praktisi untuk mengevaluasi profil bakat individu, khususnya dalam lingkungan pembelajaran ujaran L2 yang nyata, naturalistik, dan menantang (misalnya, belajar di luar negeri; Saito & Tierney, 2024 ). Penelitian saat ini bertujuan untuk menentukan apa yang dimaksud dengan presisi pendengaran yang relatif rendah dalam konteks perolehan prosodi bahasa Inggris di antara pelajar bahasa Inggris Tiongkok tingkat perguruan tinggi dengan kemampuan pemrosesan nada yang bervariasi. Dalam Studi 1, kami melacak kemahiran prosodi bahasa Inggris dari 46 pelajar bahasa Tiongkok selama periode studi 5 bulan di luar negeri di Inggris, dengan tujuan untuk mengidentifikasi ambang batas diskriminasi nada yang menentukan siapa yang mengalami kemajuan atau kemunduran selama penelitian. Untuk memperkirakan persentase populasi yang mungkin termasuk dalam kategori presisi pendengaran yang relatif tinggi versus rendah, kami melakukan Studi 2, dengan mengembangkan kumpulan data korpus yang lebih besar dari 400 pelajar bahasa Inggris Tiongkok tingkat perguruan tinggi. Pertama dan terutama, perbedaan individu dalam pemrosesan pendengaran berkorelasi signifikan dengan laju pembelajaran L2. Seperti yang diprediksi, efek bakat negatif diamati di antara pelajar dengan kemampuan pemrosesan nada yang relatif rendah. Tiga belas dari 46 pelajar yang tidak memenuhi ambang batas pemrosesan nada ( x > 14 dari 100 poin; tidak dapat mendeteksi perbedaan yang lebih kecil dari 4,2 Hz dalam frekuensi dasar) menunjukkan penurunan yang signifikan dalam kemahiran prosodi L2 setelah masa studi yang panjang di luar negeri.

Temuan kami selaras dengan penelitian yang ada tentang pelatihan bicara L2, yang menunjukkan bahwa pembelajar dengan pemrosesan pendengaran normatif mendapat manfaat dari rangsangan bicara kehidupan nyata (misalnya, banyak pembicara; Chandrasekaran et al., 2010 ), tugas autentik secara komunikatif (misalnya, pembelajaran bahasa berbasis tugas; Ruan & Saito, 2023 ; Xu et al., sedang diterbitkan ), dan pelatihan bicara L2 insidental tanpa penyediaan informasi fonetik yang eksplisit (Correia et al., sedang diterbitkan ). Sebaliknya, pembelajar dengan presisi pendengaran yang lebih rendah mungkin menghadapi kendala dan dapat lebih diuntungkan dari rangsangan bicara yang disesuaikan, seperti yang dihasilkan oleh satu pembicara (Perrachione et al., 2011 ) atau rangsangan di mana fitur akustik utama ditingkatkan (Iverson et al., 2005 ).

Dalam set data kami, partisipan dengan kemampuan pemrosesan nada rendah menunjukkan prosodi yang kurang mirip L2 dan lebih mirip L1 setelah 5 bulan perendaman. Mereka yang memiliki presisi nada rendah mungkin kesulitan untuk memperhatikan perbedaan lintas bahasa dalam penggunaan nada antara bahasa Mandarin (bahasa tonal) dan bahasa Inggris (bahasa dengan penekanan waktu). Bahasa Mandarin menggunakan variasi nada dalam suku kata untuk menyampaikan makna, sedangkan bahasa Inggris menggunakan variasi nada di seluruh suku kata untuk menekankan makna pada tingkat kalimat. Pembelajar dengan pemrosesan nada yang tidak tepat dapat memperkuat struktur prosodi L1, seperti memvariasikan nada di setiap suku kata, tanpa sepenuhnya mengadopsi prosodi tingkat kalimat mirip L2, sehingga menghasilkan prosodi L2 yang kurang mirip L1 dari waktu ke waktu (Chrabaszcz et al., 2014 ; J. Zhang et al., 2018 ).

Mengingat temuan penelitian longitudinal baru-baru ini, regresi dalam pembelajaran bicara L2 tidaklah terduga. Beberapa pembelajar mungkin terus mengandalkan strategi L1 bahkan ketika terpapar masukan L2. Misalnya, Munro et al. ( 2024 ) menunjukkan bahwa sementara produksi hentian bahasa Inggris oleh pembelajar Slavia tertentu menjadi lebih mudah dipahami dalam bulan-bulan awal pencelupan (waktu awal suara = 30 ms), produksi mereka menjadi lebih seperti L1 saat mereka menerima lebih banyak masukan L2 (waktu awal suara = 10 ms). Demikian pula, pembelajar bahasa Inggris Jepang berjuang dengan perbedaan antara [r] dan [l], sering kali mengandalkan variasi F2 dan durasi daripada variasi F3 yang lebih andal, yang mencerminkan pola dari L1 mereka (misalnya, ketukan Jepang). Penelitian pada pembelajar Jepang dewasa menunjukkan bahwa strategi persepsi mereka untuk membedakan [r] dan [l] bahasa Inggris cenderung resistan terhadap perubahan, bahkan setelah pelatihan terfokus yang ekstensif (Ingvalson et al., 2012 ) dan pengalaman pencelupan selama bertahun-tahun (Saito, 2013 ).

Bahasa Indonesia : Dalam Studi 2, menggunakan set data korpus yang lebih besar dari 400 pelajar, kami menemukan bahwa sekitar 35,2% dari populasi penutur bahasa Mandarin L1 berada di bawah ambang batas diskriminasi nada yang diidentifikasi dalam Studi 1 ( x > 14 dari 100 poin). Tanpa strategi perbaikan, pelajar ini mungkin menghadapi tantangan ketika terlibat dalam pembelajaran bicara L2 naturalistik (seperti dalam studi di luar negeri). Angka ini (35,2%) relatif tinggi dan perlu didiskusikan dengan hati-hati, terutama mengingat penelitian tentang neurodiversitas dan tantangan pembelajaran bahasa. Di Inggris dan AS, misalnya, sekitar 10–20% anak-anak dianggap neurodiverse, dengan banyak yang mengalami kesulitan terkait bahasa (misalnya, disleksia, yang memengaruhi 5–10% anak-anak; Snowling, 2013 ). Demikian pula, sekitar 10% anak-anak di Inggris berjuang dengan gangguan bahasa yang cukup parah untuk memengaruhi kinerja akademis (Norbury et al., 2016 ).

Sementara angka 35,2% mewakili proporsi yang relatif besar, temuan tersebut tidak menunjukkan bahwa dampak negatif dari ketidaktepatan pendengaran tidak dapat dihindari. Bahkan individu yang didiagnosis dengan amusia dapat meningkatkan persepsi nada mereka dan melampaui ambang amusia (Whiteford & Oxenham, 2018 ). Sebaliknya, temuan kami selaras dengan konsep interaksi bakat-pengobatan (DeKeyser, 2012 ), yang menganjurkan pengobatan yang disesuaikan dengan profil berdasarkan latar belakang neurokognitif individu. Pembelajar dengan ketepatan pendengaran yang memadai (sekitar 2,5 kuartil teratas; 65%) didorong untuk terlibat dalam lingkungan pembelajaran bicara L2 kehidupan nyata, seperti belajar di luar negeri, pembelajaran bahasa berbasis tugas, dan pembelajaran bicara L2 insidental. Sebaliknya, pelajar dengan presisi pendengaran rendah (1,5 kuartil terbawah) dapat memperoleh manfaat dari pelatihan terarah tambahan, seperti instruksi fonetik eksplisit (Suzukida & Saito, 2023 ) atau pelatihan pemrosesan pendengaran (Saito, Petrova et al., 2022 ).

Di sini, sangat penting untuk menekankan sekali lagi pendirian konseptual kita (yaitu, fungsionalisme mekanistik: McMurray et al., 2023 ), yang menyatakan bahwa pembelajar dengan profil persepsi-kognitif yang bervariasi memerlukan strategi optimal yang berbeda untuk setiap pengalaman belajar. Kami tidak memandang pembelajar dengan presisi pendengaran rendah dalam hal penyimpangan atau defisit (misalnya, mengalami kemunduran selama pencelupan L2 dibandingkan dengan pembelajar pendengaran normatif yang mendapat manfaat dari pencelupan tersebut). Sebaliknya, kami berpendapat bahwa kombinasi pencelupan naturalistik dan pelatihan lanjutan (misalnya, pelatihan fonetik dan/atau pendengaran) merupakan strategi yang optimal bagi pembelajar dengan presisi pendengaran rendah untuk sepenuhnya memanfaatkan pengalaman pencelupan naturalistik. Penting untuk menekankan bahwa pelatihan lanjutan ini dimaksudkan untuk melengkapi, bukan menggantikan, pencelupan naturalistik.

Pertimbangan metodologis utama lainnya adalah bahwa analisis tersebut dibatasi pada kurun waktu yang sangat spesifik dari pembelajaran ujaran L2 (LOR = 5–10 bulan). Meskipun pembelajar dengan presisi pendengaran yang relatif rendah ditemukan berada pada posisi yang kurang menguntungkan untuk perolehan prosodi Bahasa Inggris L2 selama periode ini, kami masih kurang wawasan tentang perjalanan pembelajaran L2 mereka yang tersisa. Studi masa depan yang melacak perkembangan prosodi pembelajar dengan presisi pendengaran yang rendah melampaui fase tengah pendalaman dapat menjelaskan apakah pembelajar ini berhenti mengalami kemajuan, dengan kinerja seperti L1 mereka yang membatu, atau apakah mereka akhirnya menyadari karakteristik akustik ujaran L2 dan melanjutkan penyempurnaan. Dalam kasus terakhir, variasi individu yang signifikan mungkin masih ada dalam hal seberapa banyak dan sejauh mana pembelajar yang “disesuaikan kembali” ini menghentikan kemunduran (kinerja seperti L1) dan akhirnya mencapai kinerja seperti L2 dari waktu ke waktu.

Memang, kumpulan data longitudinal 10 tahun milik Munro et al. ( 2024 ) tentang pembelajar bahasa Inggris L2 Slavia mengungkapkan bahwa meskipun beberapa pembelajar L2 mengalami kemunduran, khususnya sekitar 6–12 bulan pendalaman (setelah lonjakan awal dalam pembelajaran bicara L2), mereka sering kali memperoleh kembali kinerja seperti L2 setelah pendalaman ekstensif (LOR = 7 tahun). Lintasan perkembangan ini mencerminkan pola pembelajaran berbentuk U, di mana keberhasilan awal diikuti oleh kemunduran dan kemudian penyempurnaan lebih lanjut. Fenomena ini telah diamati dalam banyak konteks pembelajaran tata bahasa L2 yang berbeda, di mana pembelajar pertama-tama menunjukkan keberhasilan, kemudian kemunduran karena generalisasi yang berlebihan, dan akhirnya penyempurnaan saat mereka mendapatkan lebih banyak paparan (McLaughlin, 1990 ). Menurut penjelasan berbasis penggunaan dan emergentis tentang pembelajaran L2 (Ellis, 2015 ), pembelajar awalnya merestrukturisasi representasi mental mereka tentang bahasa berdasarkan frekuensi dan distribusi bentuk yang ditemui dalam masukan L2 mereka. Mereka sering kali menggeneralisasi aturan linguistik secara berlebihan selama proses ini, yang menyebabkan kesalahan. Namun, melalui paparan lebih banyak masukan dan umpan balik korektif dalam lingkungan interaktif sosial, pelajar menyempurnakan sistem L2 mereka.

Dalam konteks pemerolehan L1, penting untuk dicatat bahwa, meskipun ketidaktepatan pendengaran dapat memperlambat kecepatan belajar, individu dengan keterbatasan pendengaran tetap menunjukkan perkembangan bahasa yang normal dalam jangka panjang. Hal ini dapat dikaitkan dengan paparan yang cukup terhadap masukan linguistik dari pengasuh (Rosen, 2003 ), ketergantungan mereka pada fungsi eksekutif (misalnya, kontrol perhatian yang lebih besar; Snowling et al., 2018 ), dan penggunaan strategi persepsi kompensasi yang optimal (misalnya, individu yang amusic menggunakan durasi daripada isyarat nada untuk pemrosesan ucapan; Jasmin et al., 2020 ).

Secara keseluruhan, investigasi kami saat ini memberikan beberapa bukti longitudinal pertama yang menunjukkan bahwa pemrosesan pendengaran normatif diperlukan, tetapi tidak cukup, untuk pembelajaran bicara L2 yang sukses. Di satu sisi, presisi pendengaran normatif memfasilitasi dan mempercepat pembelajaran L2, khususnya ketika pembelajar secara aktif mencari, menerima, dan menggunakan masukan L2 yang lebih autentik secara komunikatif (Flege & Bohn, 2021 ). Di sisi lain, kurangnya presisi pendengaran yang memadai dapat merugikan pembelajar di lingkungan seperti itu. Pembelajar ini mungkin kesulitan dalam pengaturan bicara L2 naturalistik setidaknya dalam waktu singkat (LOR < 1 tahun), dan dengan demikian dapat lebih diuntungkan dari instruksi fonetik eksplisit dan/atau pelatihan pemrosesan pendengaran, khususnya sebelum terlibat dalam pembelajaran L2 naturalistik. Pendekatan ini akan membantu mereka untuk sepenuhnya mengoptimalkan peluang pembelajaran L2 mereka.

Mengingat hasil yang telah dipaparkan sejauh ini, akhirnya penting untuk membahas mengapa kami mengamati korelasi signifikan antara pemrosesan auditori dan kemahiran prosodi L2 pada titik akhir (T2) tetapi tidak pada awal proyek (T1). Hasil ini sejalan dengan bukti lintas bagian yang muncul yang menunjukkan bahwa pemrosesan auditori dapat menjelaskan varians yang signifikan, khususnya di antara pembelajar L2 dengan jumlah pengalaman pencelupan L2 yang memadai tetapi tidak di antara mereka yang memiliki sedikit atau tidak memiliki pengalaman pencelupan (misalnya, Saito et al., 2021 ). Studi-studi ini menunjukkan bahwa efek pemrosesan auditori pada pembelajaran bicara L2 menjadi lebih jelas saat pembelajar memperoleh pengalaman pencelupan yang lebih naturalistik (hubungan antara pemrosesan nada dan kinerja prosodi L2 menjadi signifikan pada T2 tetapi tidak pada T1).

Pada permulaan pencelupan naturalistik, pelajar dapat dengan cepat meningkatkan kemahiran bicara L2 mereka, terlepas dari profil pemrosesan pendengaran mereka. Setelah fase awal pembelajaran bicara L2, mereka yang memiliki kemampuan pemrosesan pendengaran yang lebih baik dapat memaksimalkan setiap kesempatan latihan, asalkan mereka secara aktif mencari kesempatan tersebut. Namun, mereka yang tidak mencapai ketepatan pendengaran normatif dapat menjadi bingung jika hanya terpapar pada masukan L2 yang kompleks dan nyata. Paparan ini berpotensi memfosilkan pola pemrosesan bicara L1 dan menghambat pemrosesan bicara L2 (Perrachione et al., 2011 ).

Keterbatasan
Mengingat sifat eksploratif dari proyek ini, beberapa keterbatasan harus diakui untuk memandu studi replikasi di masa mendatang. Hal ini dibahas dalam bagian di bawah ini.

Ruang Lingkup Pemrosesan Auditori dan Keragaman Partisipan
Meskipun berwawasan, tolok ukur yang disarankan dalam studi ini secara eksklusif terbatas pada diskriminasi nada dan forman dan hubungannya dengan perkembangan prosodi bahasa Inggris pembelajar bahasa Mandarin. Studi mendatang harus memperluas cakupan untuk mencakup (a) sampel pembelajar L2 yang lebih besar dan lebih beragam dengan latar belakang L1 yang bervariasi dan (b) berbagai jenis tes pemrosesan auditori (lihat, misalnya, Holt et al., 2018 , untuk perhatian selektif dimensi; Saito et al., 2021 , untuk integrasi audio-motorik). Studi validasi juga diperlukan untuk menentukan bagaimana kinerja pemrosesan auditori pembelajar L2 dapat secara unik memprediksi aspek-aspek spesifik dimensi dari pembelajaran bicara L2 (misalnya, diskriminasi forman kedua dan ketiga vs. perolehan [r] dan [l] bahasa Inggris di antara pembelajar bahasa Jepang; Saito, Hanzawa, et al., 2022 ).

Presisi Auditori Normatif
Studi ini mengisyaratkan kemungkinan bahwa kurangnya ketepatan pendengaran normatif dapat menghambat keberhasilan pembelajaran bicara L2. Dalam literatur akuisisi L1, sementara banyak studi telah menunjukkan dampak negatif seperti itu, ini sering membandingkan kelompok yang secara substansial kontrastif (mereka yang memiliki vs. tanpa gangguan bahasa). Hubungan antara pemrosesan pendengaran dan dampaknya pada pembelajaran/keterlambatan bahasa dapat sangat beragam dalam individu dengan pendengaran normal (Suprenant & Watson, 2001 ). Dengan demikian, masih terlalu dini untuk menarik kesimpulan definitif tentang efek negatif dari ketidaktepatan pendengaran dalam pembelajaran bicara L2. Studi lebih lanjut diperlukan untuk secara tepat mengurai mengapa pemrosesan pendengaran yang kurang tepat dapat memperlambat atau menghambat proses pembelajaran bicara L2.

Kemampuan Kognitif dan Pemrosesan Pendengaran
Meskipun kami menunjukkan bahwa skor diskriminasi nada peserta tidak bergantung pada skor diskriminasi forman, skor tes ini dapat dikaitkan dengan kemampuan kognitif lain seperti kontrol perhatian dan memori kerja, mengingat pemrosesan pendengaran diukur melalui tugas-tugas perilaku (Rosen, 2003 ). Studi masa depan harus mengendalikan efek perancu dari kemampuan kognitif lain dan mengeksplorasi kekuatan relatif daya prediktif di antara pemrosesan pendengaran dan variabel kognitif lain yang dipelajari dengan baik (lihat, misalnya, Huensch, 2024 , untuk memori kerja; Darcy, Mora, & Daidone, 2016 , untuk kontrol penghambatan). Akan sangat menarik untuk menyelidiki apakah mereka yang memiliki presisi pendengaran rendah dapat mengimbangi dampak negatif dari pemrosesan pendengaran, terutama ketika mereka memiliki kemampuan kognitif yang relatif hebat (Snowling et al., 2018 ). Cara lain untuk menyelidiki kekuatan prediktif pemrosesan pendengaran untuk pembelajaran bahasa tanpa pengaruh variabel kognitif yang membingungkan adalah dengan menggunakan ukuran saraf seperti respons mengikuti frekuensi, penilaian pengkodean saraf pendengaran yang relatif tidak terpengaruh oleh perhatian dan kondisi kognitif (Varghese et al., 2015 ).

Perendaman Bahasa Inggris Jangka Panjang dan Kemampuan Kognitif
Analisis kami difokuskan pada pembelajar L2 yang cukup berpengalaman (lama tinggal < 1 tahun), sedangkan banyak perhatian telah diberikan pada peran bakat dalam pencapaian akhir di antara pembelajar L2 yang sangat berpengalaman (lama tinggal > 10 tahun; Abrahamsson, 2012 ). Insiden kemahiran berbicara L2 yang sangat maju telah dikaitkan dengan berbagai kemampuan kognitif, seperti memori asosiatif, kerja, dan prosedural (Granena & Long, 2013 ; Linck et al., 2013 ; Silbert et al., 2015 ). Studi masa depan dapat mengeksplorasi bagaimana mereka yang memiliki berbagai kemampuan persepsi dan kognitif terlibat dalam pengalaman pencelupan L2 jangka panjang dan sejauh mana mereka dapat meningkatkan kemahiran berbicara L2 mereka.

Latar Belakang L1 Tonal Versus Nontonal dalam Akuisisi Prosodi L2
Sementara studi saat ini menyoroti perolehan prosodi L2, ada diskusi yang sedang berlangsung mengenai bagaimana penutur bahasa tonal versus nontonal mendekati fitur ini secara berbeda. Penelitian menunjukkan bahwa pengguna bahasa tonal mungkin memiliki keuntungan dalam perolehan prosodi L2, khususnya ketika isyarat terkait nada, seperti tekanan kata dan intonasi dalam bahasa Inggris, terlibat, karena kepekaan mereka yang lebih tinggi terhadap berbagai fitur nada, termasuk tinggi nada dan kontur. Sebaliknya, penutur L1 nontonal cenderung lebih dipengaruhi oleh sifat spektral tekanan, seperti durasi dan intensitas vokal, bahkan ketika ini bukan isyarat utama dalam perolehan prosodi L2 (untuk ringkasan yang komprehensif, lihat Jongman & Tremblay, 2020 ). Studi saat ini merupakan langkah awal untuk memeriksa interaksi kompleks antara pemrosesan nada dan perolehan prosodi L2, dengan fokus pada penutur bahasa Mandarin sebagai pengguna bahasa tonal. Penekanan ini membuka beberapa jalan untuk penelitian di masa mendatang. Pertama, akan informatif untuk menyelidiki apakah temuan tersebut berbeda jika pembelajar L2 adalah penutur bahasa nonverbal (misalnya, penutur bahasa Prancis), yang mungkin lebih mengandalkan isyarat spektral dan intensitas daripada nada untuk perolehan prosodi L2. Kedua, temuan tersebut dapat direplikasi dalam konteks di mana prosodi bahasa Inggris didorong oleh nada sebagai isyarat utama (misalnya, tekanan kata dan intonasi), serta dalam konteks di mana durasi, bukan nada, memainkan peran penting (misalnya, batas frasa).

Petunjuk Temporal dalam Akuisisi Prosodi L2
Dalam penelitian saat ini, kami mengajukan dan memberikan bukti pendukung bahwa pemrosesan nada yang lebih tepat dapat memfasilitasi perolehan prosodi Bahasa Inggris L2. Dalam kasus tekanan kata, penelitian yang ada menunjukkan bahwa pendengar asli Bahasa Inggris tidak hanya menggunakan nada sebagai isyarat utama tetapi juga durasi dan intensitas sebagai isyarat sekunder (Fry, 1958 ; Lieberman, 1960 ). Menariknya, pendengar Bahasa Mandarin cenderung terlalu bergantung pada nada (Y. Zhang et al., 2008 ). Penelitian di masa mendatang harus menyelidiki bagaimana pendengar Bahasa Mandarin dengan kepekaan yang lebih tinggi terhadap durasi dan intensitas dapat meningkatkan kemahiran prosodi Bahasa Inggris mereka, memungkinkan mereka untuk terus menggunakan nada sebagai isyarat sambil mencapai kinerja yang mendekati penutur asli.

Kesimpulan
Mengacu pada teori sensorik tentang perolehan L1, semakin banyak penelitian yang menunjukkan bahwa mekanisme pemrosesan pendengaran umum domain mendukung laju pembelajaran bicara L2 orang dewasa (Mueller et al., 2012 ). Hal ini khususnya relevan ketika pelajar terlibat dengan bahasa target dalam konteks komunikatif autentik di kehidupan nyata dengan cara yang mirip dengan perolehan L1 (Saito et al., 2022 ). Dalam penelitian ini, kami membangun hipotesis yang muncul bahwa, sementara ketepatan pendengaran umumnya berhubungan dengan pembelajaran bahasa, pengaruhnya akan paling jelas di antara mereka yang memiliki ketepatan pendengaran yang lebih rendah, yang menunjukkan bahwa ketepatan pendengaran yang berkurang dapat menghambat perkembangan bicara L2 mereka.

Analisis kami berfokus pada hubungan khusus dimensi antara pengembangan kemahiran prosodi bahasa Inggris pada pembelajar bahasa Mandarin dan perbedaan individual mereka dalam kemampuan pemrosesan nada. Studi 1 melacak 46 pembelajar bahasa Mandarin dalam konteks studi ke luar negeri dan menemukan interaksi signifikan antara penggunaan L2 dan peningkatan dalam kelompok dengan kemampuan pemrosesan auditori normatif. Menggemakan literatur sebelumnya (Flege & Bohn, 2021 ), hal ini menunjukkan bahwa pembelajar dengan kemampuan pemrosesan nada normatif terus meningkatkan produksi prosodi bahasa Inggris mereka sebagai hasil dari peningkatan penggunaan L2 harian.

Sebaliknya, pembelajar dengan kemampuan pemrosesan nada rendah menunjukkan regresi, kemungkinan karena pembelajar yang tidak siap secara persepsi ini memproses masukan L2 yang lebih autentik melalui pola prosodi L1 mereka, yang mengarah ke keluaran yang lebih merupakan karakteristik L1 dan kurang mewakili L2. Seperti dicatat oleh Munro et al. ( 2024 ), dan dikonseptualisasikan sebagai lintasan pembelajaran berbentuk U di bawah akun berbasis penggunaan pembelajaran L2 (Ellis, 2015 ), fenomena regresi dapat ditemukan di antara pembelajar L2 tertentu, terutama selama fase awal hingga pertengahan pembelajaran bicara L2. Di sini, kami menambahkan bahwa regresi dapat dikaitkan dengan perbedaan individu dalam pemrosesan pendengaran yang tidak tepat. Mengacu pada korpus besar data diskriminasi nada dari populasi yang sama ( n = 400 pembelajar bahasa Inggris tingkat universitas Tiongkok), Studi 2 menunjukkan bahwa sekitar 1,5 kuartil terbawah (35,2%) individu dengan pendengaran normal termasuk dalam kategori presisi pendengaran rendah ini.

Interaksi antara pengalaman, pemrosesan auditori, dan pembelajaran ujaran L2 menawarkan berbagai implikasi bagi praktisi dan peneliti. Pertama, mengekspos pelajar dengan kemampuan pemrosesan auditori suboptimal pada masukan ujaran L2 yang naturalistis dan nyata dapat menghambat—atau setidaknya tidak mendorong—pembelajaran ujaran L2 mereka. Individu tersebut dapat memperoleh manfaat dari masukan dan pelatihan L2 yang dimodifikasi dan disesuaikan untuk secara efektif membedakan dan memahami perbedaan persepsi antara L1 dan L2, dengan demikian mengembangkan representasi fonetik L2 baru relatif terhadap rekan-rekan L1 mereka. Mereka yang dianggap belum siap secara persepsi (yaitu, di bawah rentang presisi auditori normatif) harus didorong untuk terlibat dalam instruksi fonetik eksplisit, di mana mereka dapat mendengar ujaran yang ditingkatkan secara akustik, khususnya dalam pengaturan tatap muka (Suzukida & Saito, 2023 ).

Sebaliknya, individu dengan pemrosesan pendengaran normatif harus didorong untuk menggunakan dan mempraktikkan bahasa target sesering mungkin. Mereka dianggap siap secara perseptual untuk memanfaatkan peluang praktik L2 yang luas dan autentik secara komunikatif. Individu-individu ini harus didorong tidak hanya untuk mengembangkan dan merevisi representasi fonetik L2 mereka tetapi juga untuk mengotomatiskannya melalui peluang-peluang tersebut (misalnya, belajar di luar negeri, pembelajaran bahasa berbasis tugas).

Zenitconsultants: Panduan Lengkap Bahasa dan Ilmu Linguistik

Zenitconsultants menyajikan panduan lengkap tentang bahasa dan ilmu linguistik, mulai dari teori dasar hingga aplikasi praktis dalam kehidupan sehari-hari.

Peran Pemrosesan Auditori Domain-Umum dalam Pembelajaran Ucapan Bahasa Kedua Ditinjau Kembali: Tingkat Presisi Apa yang Membuat Perbedaan?

About the Author: zenitconsultants

Tinggalkan Balasan Batalkan balasan

You May Also Like

Morfologi Fusi

Ilokusi

About the Author: zenitconsultants

Tinggalkan Balasan Batalkan balasan