Regresi linier adalah metode statistik yang sangat berguna untuk memahami bagaimana dua variabel saling berhubungan. Melalui regresi linier, kita dapat memprediksi atau mengestimasi nilai suatu variabel berdasarkan nilai variabel lainnya. Bayangkan regresi linier seperti mencari "pola" hubungan antara dua hal yang kita ukur.
Apa itu Regresi Linier?
Dalam istilah sederhana, regresi linier adalah cara untuk menemukan garis lurus terbaik yang melintasi sekumpulan titik data.
Contoh nyata: Sebuah perusahaan pertambangan ingin memahami hubungan antara kedalaman pengeboran (dalam meter) dengan jumlah mineral yang ditemukan (dalam ton).
Kedalaman (m)
Mineral (ton)
50
10
100
22
150
35
200
47
250
58
Dengan regresi linier, perusahaan dapat menemukan hubungan matematis dan memprediksi jumlah mineral yang mungkin ditemukan pada kedalaman tertentu.
Persamaan regresi linier sederhana dapat dituliskan sebagai:
\[ Y = \beta_0 + \beta_1 X + \varepsilon \]
Dimana:
\( Y \) = variabel dependen (yang ingin diprediksi, misalnya jumlah mineral)
\( X \) = variabel independen (faktor yang mempengaruhi, misalnya kedalaman)
\( \beta_0 \) = intercept (nilai Y ketika X = 0)
\( \beta_1 \) = slope (seberapa banyak Y berubah ketika X bertambah 1 unit)
\( \varepsilon \) = error term (faktor lain yang mempengaruhi Y tapi tidak dijelaskan oleh X)
Mengapa Regresi Linier Penting?
Dalam dunia pertambangan dan geologi, regresi linier sangat bermanfaat untuk:
Memperkirakan cadangan mineral berdasarkan parameter geologis
Memprediksi tingkat produksi berdasarkan jam operasi mesin
Menganalisis hubungan antara biaya operasional dengan jumlah material yang ditambang
Mengestimasi umur tambang berdasarkan tingkat ekstraksi
Memahami faktor-faktor yang mempengaruhi efisiensi proses pertambangan
Dengan memahami regresi linier dan menggunakan Excel, para insinyur dan manajer tambang dapat membuat keputusan yang lebih baik berdasarkan data.
Teori Regresi Linier
Variabel Dependen dan Independen
Sebelum mempelajari regresi linier lebih lanjut, penting untuk memahami konsep variabel dependen dan independen.
Definisi dan Karakteristik
Variabel Independen (X)
Disebut juga variabel prediktor atau variabel bebas
Merupakan variabel yang mempengaruhi variabel lain
Nilai variabel ini biasanya dapat dikontrol atau dipilih
Ditempatkan pada sumbu X dalam grafik
Dalam rumus: posisinya sebagai \(X\)
Variabel Dependen (Y)
Disebut juga variabel respons atau variabel terikat
Merupakan variabel yang dipengaruhi oleh variabel independen
Nilai variabel ini diamati dan diukur sebagai hasil eksperimen
Ditempatkan pada sumbu Y dalam grafik
Dalam rumus: posisinya sebagai \(Y\)
Cara Mengidentifikasi
Untuk membedakan variabel dependen dan independen, ajukan pertanyaan-pertanyaan berikut:
Apa yang ingin saya prediksi atau jelaskan? (Ini adalah variabel dependen)
Faktor apa yang saya duga mempengaruhi variabel tersebut? (Ini adalah variabel independen)
Mana yang merupakan sebab, dan mana yang merupakan akibat? (Sebab = independen, akibat = dependen)
Mana yang saya kontrol dalam praktiknya? (Biasanya ini adalah variabel independen)
Contoh dalam Konteks Pertambangan
Contoh 1: Kedalaman Pengeboran dan Hasil Mineral
Variabel Independen (X): Kedalaman pengeboran (meter)
Variabel Dependen (Y): Jumlah mineral yang ditemukan (ton)
Alasan: Kita mengontrol seberapa dalam pengeboran dilakukan, dan hasilnya adalah jumlah mineral yang kita temukan. Kedalaman pengeboran mempengaruhi jumlah mineral, bukan sebaliknya.
Contoh 2: Jam Operasi dan Produksi Tambang
Variabel Independen (X): Jam operasi alat berat (jam/hari)
Variabel Dependen (Y): Jumlah material yang tertambang (ton/hari)
Alasan: Kita menentukan berapa jam alat berat beroperasi, dan hasilnya adalah jumlah material yang tertambang. Jam operasi mempengaruhi jumlah material, bukan sebaliknya.
Contoh 3: Konsentrasi Bahan Kimia dan Efisiensi Ekstraksi
Variabel Independen (X): Konsentrasi bahan kimia dalam proses ekstraksi (%)
Variabel Dependen (Y): Efisiensi ekstraksi (%)
Alasan: Kita mengontrol berapa konsentrasi bahan kimia yang digunakan, dan hasilnya adalah tingkat efisiensi ekstraksi. Konsentrasi mempengaruhi efisiensi, bukan sebaliknya.
Metode Kuadrat Terkecil (Least Squares Method)
Bagaimana cara menemukan garis terbaik yang sesuai dengan sekumpulan titik data? Jawabannya adalah dengan menggunakan metode kuadrat terkecil. Mari kita pahami konsep ini dengan bahasa sederhana.
Bayangkan Anda memiliki data hasil pengeboran di beberapa lokasi tambang. Anda ingin menemukan hubungan antara kedalaman pengeboran (X) dengan jumlah mineral yang ditemukan (Y).
Ketika kita menggambar garis regresi, ada kesalahan (error) atau perbedaan antara nilai Y yang sebenarnya dengan nilai Y yang diprediksi oleh garis. Kesalahan ini disebut residual.
Metode kuadrat terkecil mencari garis dengan jumlah kuadrat residual yang paling kecil. Mengapa dikuadratkan? Karena kita tidak ingin residual positif dan negatif saling menghilangkan.
Garis hijau adalah garis regresi
Garis merah putus-putus adalah residual (kesalahan)
Metode kuadrat terkecil meminimalkan jumlah kuadrat panjang garis merah
Simulasi: Mengapa "Kuadrat Terkecil" dan Apa itu "Garis Terbaik"?
Mari kita jelaskan konsep "kuadrat terkecil" dan "garis terbaik" melalui simulasi sederhana:
Perhatikan data pengeboran di bawah ini. Kita memiliki beberapa titik data dan tiga garis berbeda (A, B, dan C) yang mencoba menjelaskan hubungan antara X dan Y:
Garis A (Merah)
Y = 10 + 0.15X
Jumlah kuadrat residual: 0
Garis B (Hijau)
Y = -1.5 + 0.245X
Jumlah kuadrat residual: 0
Garis C (Biru)
Y = -10 + 0.35X
Jumlah kuadrat residual: 0
Mengapa "Kuadrat"?
Residual adalah selisih antara nilai Y aktual dengan nilai Y yang diprediksi oleh garis. Jika kita hanya menjumlahkan residual tanpa mengkuadratkan, residual positif dan negatif akan saling menghilangkan:
X (Kedalaman)
Y Aktual
Y Prediksi
Residual
Residual²
50
10
10.75
-0.75
0.56
100
22
23.00
-1.00
1.00
150
35
35.25
-0.25
0.06
200
47
47.50
-0.50
0.25
Jumlah
-2.50
1.87
Perhatikan bahwa jumlah residual adalah -2.50, tetapi ini tidak mencerminkan seberapa baik kecocokan garis. Sebuah garis buruk bisa saja memiliki jumlah residual mendekati nol jika kesalahan positif dan negatif saling menghilangkan. Dengan mengkuadratkan residual, semua nilai menjadi positif, sehingga tidak ada yang saling menghilangkan.
Apa itu "Garis Terbaik"?
Garis terbaik adalah garis yang memiliki jumlah kuadrat residual paling kecil (Sum of Squared Errors/SSE). Dari ketiga garis di grafik di atas:
Garis A (merah) terlalu landai (slope terlalu kecil)
Garis B (hijau) adalah garis terbaik berdasarkan metode kuadrat terkecil
Garis C (biru) terlalu curam (slope terlalu besar)
Garis B memiliki SSE (Sum of Squared Errors) yang paling kecil di antara ketiga garis. Ini berarti jika Anda menjumlahkan kuadrat dari semua residual (jarak vertikal antara titik data dan garis), garis B akan memberikan nilai total yang paling kecil.
Itulah mengapa metode ini disebut "metode kuadrat terkecil" - kita mencari garis dengan jumlah kuadrat residual yang paling kecil.
\( \bar{X} \) = rata-rata nilai X (misalnya rata-rata kedalaman pengeboran)
\( \bar{Y} \) = rata-rata nilai Y (misalnya rata-rata jumlah mineral)
Koefisien Determinasi (R²): Mengukur Kecocokan Model
Setelah menemukan garis regresi, pertanyaan berikutnya adalah: "Seberapa baik garis ini menjelaskan data kita?" Untuk menjawabnya, kita menggunakan koefisien determinasi atau R².
R² mengukur persentase variasi dalam Y yang dapat dijelaskan oleh X melalui model regresi kita. Nilai R² berkisar dari 0 hingga 1:
R² = 1: Model sempurna, 100% variasi Y dijelaskan oleh X
R² = 0.75: 75% variasi Y dijelaskan oleh X
R² = 0.3: Hanya 30% variasi Y dijelaskan oleh X
R² = 0: X tidak menjelaskan variasi Y sama sekali
Contoh: Jika dalam analisis hubungan antara kedalaman pengeboran dan jumlah mineral kita mendapatkan R² = 0.85, ini berarti 85% variasi jumlah mineral dapat dijelaskan oleh kedalaman pengeboran. Sisanya 15% mungkin dipengaruhi oleh faktor lain seperti jenis batuan, lokasi geografis, dll.
\( SS_{tot} = \sum_{i=1}^{n} (Y_i - \bar{Y})^2 \) = Jumlah kuadrat total variasi Y
Uji Signifikansi: Apakah Model Kita Dapat Dipercaya?
Setelah menemukan model regresi dan mengukur kecocokannya, kita perlu mengetahui apakah hubungan yang kita temukan benar-benar signifikan secara statistik atau hanya kebetulan.
Untuk menguji signifikansi, kita menggunakan uji-t untuk koefisien (beta) dan nilai p (p-value):
Uji-t: Membandingkan nilai koefisien dengan standard error-nya. Semakin besar nilai |t|, semakin signifikan hubungannya.
P-value: Memberikan probabilitas mendapatkan hasil seperti itu jika sebenarnya tidak ada hubungan. Biasanya kita menggunakan ambang batas 0.05 (5%).
Interpretasi p-value:
p < 0.05: Hubungan signifikan (kita percaya ada hubungan antara X dan Y)
p ≥ 0.05: Hubungan tidak signifikan (kita tidak bisa yakin ada hubungan antara X dan Y)
Contoh: Dalam analisis hubungan kedalaman pengeboran dengan jumlah mineral, jika p-value untuk slope (β₁) adalah 0.002, ini berarti kemungkinan menemukan hubungan ini secara kebetulan sangat kecil (0.2%), sehingga kita bisa percaya bahwa hubungan ini signifikan.
Nilai t untuk koefisien slope (\(\beta_1\)) dihitung dengan:
Dengan \(SS_{xx} = \sum_{i=1}^{n} (X_i - \bar{X})^2\) dan n adalah jumlah data.
Penggunaan Data Analysis Toolpak di Excel
Mengaktifkan Data Analysis Toolpak
Buka Excel dan klik pada tab File
Pilih Options (atau Opsi pada versi bahasa Indonesia)
Pada jendela Excel Options, pilih Add-Ins di menu sebelah kiri
Di bagian bawah, pastikan "Excel Add-ins" terpilih pada dropdown "Manage" dan klik Go
Centang kotak di samping Analysis ToolPak dan klik OK
Setelah diaktifkan, Data Analysis Toolpak akan muncul di tab Data pada grup Analysis.
Visualisasi: Menu Data Analysis di Excel
Langkah-langkah Analisis Regresi
Siapkan data dalam dua kolom: satu untuk variabel independen (X) dan satu untuk variabel dependen (Y)
Klik tab Data
Klik Data Analysis di grup Analysis
Pilih Regression dari daftar alat analisis dan klik OK
Di kotak dialog Regression, isi:
Input Y Range: Pilih rentang sel untuk data variabel dependen (Y)
Input X Range: Pilih rentang sel untuk data variabel independen (X)
Centang Labels jika baris pertama berisi label
Pilih lokasi output (Output Range, New Worksheet, atau New Workbook)
Centang opsi sesuai kebutuhan (Residuals, Standardized Residuals, dll.)
Klik OK untuk menjalankan analisis regresi
Visualisasi: Dialog Regresi di Excel
Opsi "Constant is Zero"
Opsi "Constant is Zero" memaksa model regresi untuk melewati titik asal (0,0). Dalam persamaan \(Y = \beta_0 + \beta_1 X\), opsi ini memaksa \(\beta_0 = 0\), sehingga persamaan menjadi \(Y = \beta_1 X\).
Mengapa di pertambangan biasanya tidak dicentang?
Pada kebanyakan kasus pertambangan, nilai Y (misalnya jumlah mineral) tidak selalu nol ketika X (misalnya kedalaman) nol. Contohnya, mineral bisa ditemukan di permukaan atau dekat permukaan.
Memaksa garis melalui titik (0,0) dapat menghasilkan model yang kurang akurat jika hubungan alami data tidak melewati titik tersebut.
Data pertambangan biasanya dikumpulkan pada rentang yang jauh dari titik asal (0,0), misalnya kedalaman pengeboran mulai dari 50 meter. Mengekstrapolasi ke titik asal tanpa data pendukung dapat mengurangi keakuratan model.
Dalam konteks pertambangan, kita lebih tertarik pada hubungan dalam rentang data yang diamati daripada asumsi teoretis bahwa "tidak ada kedalaman berarti tidak ada mineral".
Constant is Zero: Tidak Dicentang
Y = β₀ + β₁X (intersep ≠ 0)
Garis yang paling cocok dengan data, βₒ bisa positif atau negatif
Constant is Zero: Dicentang
Y = β₁X (intersep = 0)
Garis dipaksa melewati (0,0), menghasilkan kecocokan yang kurang optimal dengan data
Opsi "Residuals"
Opsi "Residuals" dalam dialog regresi Excel memungkinkan pengguna untuk menampilkan nilai residual (selisih antara nilai aktual dan nilai yang diprediksi) dalam output analisis.
Mengapa opsi Residuals biasanya tidak dicentang?
Untuk analisis sederhana atau pemula, residual mungkin tidak diperlukan karena fokus utama adalah persamaan regresi dan statistik uji (R², p-value).
Output Excel menjadi lebih sederhana dan mudah dibaca tanpa tabel residual tambahan.
Saat bekerja dengan dataset besar, tabel residual dapat menjadi sangat panjang dan menyulitkan navigasi output.
Kapan Residuals sebaiknya dicentang?
Ketika Anda perlu memeriksa asumsi regresi linier seperti normalitas residual dan homoskedastisitas (varians konstan).
Untuk mengidentifikasi outlier atau titik data yang tidak biasa yang memiliki residual yang sangat besar.
Saat melakukan analisis diagnostik untuk memastikan model cocok dengan data.
Ketika Anda ingin memplot residual untuk analisis visual lebih lanjut.
Penjelasan Konsep Penting:
1. Normalitas Residual
Normalitas residual adalah asumsi bahwa residual (error) dari model regresi terdistribusi secara normal. Ini penting karena:
Memastikan bahwa uji statistik (t-test, F-test) dan interval kepercayaan valid
Menunjukkan bahwa faktor-faktor yang tidak dijelaskan dalam model memiliki pengaruh acak, bukan sistematis
Dapat diperiksa secara visual dengan histogram residual atau plot Q-Q normal
Dalam konteks pertambangan, residual yang tidak normal bisa mengindikasikan ada variabel penting yang tidak dimasukkan dalam model, seperti jenis batuan atau kondisi geologis tertentu
2. Homoskedastisitas (Varians Konstan)
Homoskedastisitas adalah asumsi bahwa residual memiliki varians yang sama di semua nilai variabel independen. Konsep ini penting karena:
Memastikan estimasi parameter (koefisien) efisien dan tidak bias
Jika asumsi ini dilanggar (disebut heteroskedastisitas), interval kepercayaan menjadi tidak akurat
Dapat diperiksa dengan membuat scatter plot residual terhadap nilai prediksi atau variabel independen
Dalam analisis pertambangan, heteroskedastisitas bisa terjadi jika, misalnya, variabilitas hasil mineral meningkat saat kedalaman bertambah
3. Outlier
Outlier adalah titik data yang secara signifikan berbeda dari pola umum data lainnya. Dalam konteks regresi:
Dapat diidentifikasi dari residual yang sangat besar (biasanya > 2 atau 3 kali standar deviasi)
Dapat memiliki pengaruh besar pada estimasi koefisien dan mengurangi kecocokan model
"Standardized Residuals" memudahkan identifikasi outlier karena dikonversi ke skala standar
Dalam data pertambangan, outlier bisa disebabkan oleh kondisi geologis khusus (misalnya kantong mineral yang sangat kaya) atau kesalahan pengukuran
Perlu dianalisis secara hati-hati untuk menentukan apakah harus dipertahankan, dimodifikasi, atau dihapus dari analisis
Jika Anda diharuskan untuk menampilkan residual, Anda dapat memilih antara "Residuals" (nilai residual biasa) atau "Standardized Residuals" (residual yang distandardisasi untuk memudahkan identifikasi outlier).
Interpretasi Hasil
Hasil analisis regresi Excel memberikan beberapa tabel yang berisi informasi penting:
1. Regression Statistics
Multiple R: Koefisien korelasi antara X dan Y
R Square (R²): Koefisien determinasi
Adjusted R Square: R² yang disesuaikan untuk jumlah variabel independen
Standard Error: Kesalahan standar estimasi
Observations: Jumlah data yang dianalisis
2. ANOVA (Analysis of Variance)
SS: Sum of Squares (Jumlah Kuadrat)
df: Degrees of Freedom (Derajat Kebebasan)
MS: Mean Square (Rata-rata Kuadrat)
F: F-statistic (uji global)
Significance F: p-value untuk F-statistic
3. Coefficients
Intercept: Nilai \(\beta_0\) (konstanta)
X Variable: Nilai \(\beta_1\) (slope)
Standard Error: Kesalahan standar untuk koefisien
t Stat: t-value untuk koefisien
P-value: Nilai signifikansi untuk koefisien
Lower 95% & Upper 95%: Interval kepercayaan 95% untuk koefisien
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.9944
R Square
0.9889
Adjusted R Square
0.9863
Standard Error
1.5486
Observations
10
ANOVA
df
SS
MS
F
Regression
1
1770.63
1770.63
738.68
Residual
8
19.17
2.40
Total
9
1789.80
Coefficients
Standard Error
t Stat
P-value
Intercept
63.57
1.23
51.68
2.21E-11
X Variable
2.05
0.08
27.18
3.96E-09
Contoh: Hasil Analisis Regresi di Excel
Langkah Demi Langkah Analisis Regresi di Excel
Pada bagian ini, kita akan membahas langkah demi langkah cara melakukan analisis regresi linier di Excel menggunakan Data Analysis Toolpak. Mari ikuti panduan berikut dengan contoh data pertambangan.
Langkah 1: Persiapan Data di Excel
Pertama, siapkan data dalam dua kolom yang terpisah. Satu kolom untuk variabel independen (X) dan satu kolom untuk variabel dependen (Y).
Gambar 1: Menyiapkan data dalam format kolom di Excel
Pastikan untuk:
Memasukkan data dengan benar tanpa kesalahan pengetikan
Memastikan data dalam format angka, bukan teks
Menambahkan judul kolom (opsional, tapi direkomendasikan)
Tidak menyertakan sel kosong di antara data
Langkah 2: Mengakses Data Analysis Toolpak
Setelah Data Analysis Toolpak sudah diaktifkan (lihat tab sebelumnya), buka tab "Data" dan klik "Data Analysis" di bagian atas kanan ribbon Excel.
Gambar 2: Mengakses Data Analysis dari tab Data
Langkah 3: Memilih Analisis Regresi
Setelah mengklik "Data Analysis", pilih "Regression" dari daftar alat analisis yang tersedia. Scroll ke bawah jika perlu, karena alat diurutkan berdasarkan abjad.
Gambar 3: Memilih "Regression" dari dialog Data Analysis
Langkah 4: Mengisi Dialog Regresi
Setelah memilih "Regression", Anda perlu mengisi beberapa parameter dalam dialog regresi:
Gambar 4: Mengisi dialog Regression
Penjelasan parameter:
Input Y Range: Rentang sel yang berisi data variabel dependen (termasuk header jika ada)
Input X Range: Rentang sel yang berisi data variabel independen (termasuk header jika ada)
Labels: Centang jika baris pertama dalam rentang data Anda berisi label kolom
Constant is Zero: Centang jika Anda ingin memaksa garis regresi melewati titik (0,0). Untuk analisis pertambangan, biasanya tidak dicentang.
Output Range: Lokasi di mana hasil analisis regresi akan ditampilkan
Residuals: Opsi untuk menampilkan nilai residual (selisih antara nilai sebenarnya dan nilai prediksi)
Langkah 5: Memahami Output Regresi Excel
Setelah Anda mengklik "OK", Excel akan menghasilkan output analisis regresi yang terdiri dari beberapa tabel. Mari kita pahami masing-masing komponen output:
A. Tabel Regression Statistics
Regression Statistics
Multiple R
0.9991
R Square
0.9982
Adjusted R Square
0.9976
Standard Error
0.8543
Observations
4
Penjelasan:
Multiple R (0.9991): Koefisien korelasi Pearson antara variabel X dan Y. Nilai mendekati 1 menunjukkan korelasi positif yang sangat kuat antara kedalaman pengeboran dan jumlah mineral yang ditemukan.
R Square (0.9982): Koefisien determinasi. Menunjukkan bahwa 99.82% variasi dalam jumlah mineral (Y) dapat dijelaskan oleh kedalaman pengeboran (X).
Adjusted R Square (0.9976): R² yang disesuaikan untuk jumlah variabel dan ukuran sampel. Nilai ini lebih penting ketika ada banyak variabel independen.
Standard Error (0.8543): Kesalahan standar estimasi, mengukur sebaran titik data di sekitar garis regresi dalam satuan variabel Y (ton).
Observations (4): Jumlah titik data yang digunakan dalam analisis.
B. Tabel ANOVA (Analysis of Variance)
df
SS
MS
F
Significance F
Regression
1
1083.75
1083.75
1484.72
0.0000165
Residual
2
1.46
0.73
Total
3
1085.21
Penjelasan:
df (Degrees of Freedom): Regresi = 1 (jumlah variabel independen), Residual = 2 (n - k - 1), Total = 3 (n - 1)
SS (Sum of Squares):
Regression (1083.75): Jumlah kuadrat yang dijelaskan oleh model
Residual (1.46): Jumlah kuadrat yang tidak dijelaskan (error)
Total (1085.21): Total variasi dalam data Y
MS (Mean Square): SS dibagi df, mengukur varians
F (1484.72): Rasio varians yang dijelaskan terhadap varians yang tidak dijelaskan. Nilai F yang tinggi menunjukkan model signifikan
Significance F (0.0000165): P-value untuk statistik F. Nilai sangat kecil (< 0.05) menunjukkan model sangat signifikan secara statistik
C. Tabel Coefficients
Coefficients
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
Intercept
-1.8
1.263
-1.425
0.290
-7.201
3.601
Kedalaman
0.245
0.006
38.53
0.0000165
0.218
0.272
Penjelasan:
Intercept (-1.8): Nilai konstanta (\(\beta_0\)). Secara teoritis, ketika kedalaman = 0, jumlah mineral = -1.8 ton. Dalam konteks ini, nilai ini mungkin tidak bermakna praktis.
Kedalaman (0.245): Koefisien slope (\(\beta_1\)). Untuk setiap penambahan 1 meter kedalaman, jumlah mineral bertambah sebesar 0.245 ton.
Standard Error: Kesalahan standar koefisien, mengukur presisi estimasi
t Stat: Koefisien dibagi standard error. Nilai t yang lebih besar (dalam nilai absolut) menunjukkan koefisien lebih signifikan
P-value:
Intercept (0.290): Nilai > 0.05, berarti intercept tidak signifikan secara statistik
Kedalaman (0.0000165): Nilai << 0.05, menunjukkan koefisien kedalaman sangat signifikan
Lower/Upper 95%: Batas bawah dan atas interval kepercayaan 95% untuk koefisien
Persamaan Regresi Linier
Y = -1.8 + 0.245X
Jumlah Mineral (ton) = -1.8 + 0.245 × Kedalaman (meter)
Dengan persamaan ini, kita dapat:
Prediksi: Memperkirakan jumlah mineral pada kedalaman tertentu.
Contoh: Pada kedalaman 175 meter → Y = -1.8 + 0.245(175) = 41.08 ton
Perencanaan: Menentukan kedalaman pengeboran yang diperlukan untuk mendapatkan jumlah mineral tertentu.
Contoh: Untuk mendapatkan 30 ton mineral → X = (30 + 1.8) / 0.245 = 129.8 meter
Analisis Lanjutan: Sebagai dasar untuk model prediksi yang lebih kompleks atau untuk memahami hubungan antara variabel-variabel pertambangan.
Latihan Regresi Linier: Aplikasi di Bidang Pertambangan
Studi Kasus Pertambangan
Berikut ini adalah studi kasus pertambangan yang dapat Anda selesaikan menggunakan Data Analysis Toolpak di Excel untuk melatih pemahaman Anda tentang regresi linier dalam konteks industri pertambangan.
Studi Kasus 1: Kedalaman Pengeboran dan Hasil Mineral
PT Mineral Utama sedang melakukan analisis untuk memahami hubungan antara kedalaman pengeboran (dalam meter) dan jumlah mineral berharga (dalam ton) yang diperoleh dari beberapa lokasi pengeboran. Data dari 10 lokasi pengeboran disajikan di bawah ini:
Lokasi Pengeboran
Kedalaman (m)
Hasil Mineral (ton)
A1
50
12.5
A2
75
18.2
A3
100
24.7
B1
125
31.3
B2
150
36.8
B3
175
42.5
C1
200
49.1
C2
225
53.4
C3
250
59.2
D1
275
63.8
Tugas Analisis:
Gunakan Data Analysis Toolpak di Excel untuk menentukan persamaan regresi linier dari data tersebut. Bagaimana bentuk persamaan matematisnya?
Hitung dan interpretasikan nilai R² dari model regresi ini. Apa artinya dalam konteks pertambangan ini?
Jika perusahaan berencana melakukan pengeboran baru dengan kedalaman 180 meter, berapa ton mineral yang diperkirakan dapat diperoleh?
Perusahaan menargetkan untuk mendapatkan 45 ton mineral. Berapa kedalaman pengeboran yang sebaiknya dilakukan? (Petunjuk: gunakan rumus \(X = \frac{Y - \beta_0}{\beta_1}\))
Solusi:
1. Persamaan Regresi: Y = 1.67 + 0.23X
Interpretasi: Nilai intercept (1.67) adalah jumlah mineral yang diperkirakan pada kedalaman 0 meter (meskipun ini hanya teoritis). Nilai slope (0.23) menunjukkan bahwa untuk setiap penambahan 1 meter kedalaman pengeboran, diperkirakan akan diperoleh tambahan 0.23 ton mineral.
2. Nilai R²: 0.997
Interpretasi: Nilai R² yang sangat tinggi (99.7%) menunjukkan bahwa kedalaman pengeboran dapat menjelaskan hampir seluruh variasi hasil mineral yang diperoleh. Ini berarti kedalaman pengeboran adalah prediktor yang sangat baik untuk hasil mineral di lokasi tambang ini.
3. Estimasi mineral pada kedalaman 180 meter:
Y = 1.67 + 0.23(180) = 43.07 ton
Jadi, pada kedalaman 180 meter diperkirakan akan diperoleh 43.07 ton mineral.
4. Kedalaman yang diperlukan untuk mendapatkan 45 ton mineral:
X = (45 - 1.67) / 0.23 = 188.39 meter
Jadi, perusahaan sebaiknya melakukan pengeboran sedalam sekitar 189 meter untuk mendapatkan target 45 ton mineral.