s:
Pada titik tertentu, perangkat terbesar di pasar akan terisi dan arsitektur yang berbeda diperlukan.
Prosesor baru dapat memberikan kecepatan yang lebih besar, namun sekali lagi, teknologi yang ada
memiliki batasnya, dan kinerja yang lebih tinggi cenderung lebih mahal secara tidak proporsional.
Selanjutnya, satu prosesor dan satu array penyimpanan menjadi titik potensial kegagalan bencana.
Big data membutuhkan arsitektur yang dapat dengan mudah menskalakan ke kapasitas yang hampir
tidak terbatas.
Gambar 4.5 dan 4-6 Arsitektur Komputasi Konvensional dan Skala Arsitektur Konvensional dengan
Menambahkan komponen yang Lebih Banyak, Lebih Besar, atau Lebih Cepat
Kerangka kerja Apache Hadoop (lihat http://hadoop.apache.org) yaitu lingkungan perangkat lunak
untuk menjalankan proyek big data. pemakai seperti Yahoo!, LinkedIn, dan Twitter memakai
cluster Hadoop untuk mengelola data yang mereka kumpulkan.Hadoop digadang-gadang mampu
311
menyelesaiakan permasalahan yang berkaitan dengan data dengan jumlah yang sangat besar
atau Big Data. Dengan banyaknya aliran data dalam perkembangan internet saat ini, Hadoop dapat
menjadi solusi saat diperlukan model penyimpanan dan pengelolaan data dalam jumlah yang sangat
besar. Selain itu, dengan adanya variasi data yang sangat banyak serta kebutuhan akses data yang
harus cepat pula, Hadoop diharapkan dapat menyelesaikan permasalahan ini .
Beberapa perusahaan besar memakai Hadoop untuk mengelola data mereka dalam jumlah
sangat besar. Perusahaan ini diantaranya Yahoo! dan Facebook dengan klaim bahwa Facebook
memiliki Cluster Hadoop terbesar di dunia, yakni per 13 Juni 2012 mereka memiliki 100 petabyte dan
per tanggal 8 November 2012, pemakai an data di Facebook naik kurang lebih setengah Petabyte
per hari. 1 Petabyte setara dengan 1.000.000 Gigabyte. Tidak heran, sebab jumlah pemakai
Faecbook di seluruh dunia hampir mencapai 2 milyar. Bayangkan jumlah data yang mengalir dan
disimpan setiap harinya.
Hadoop mendukung penyimpanan dan pemrosesan data terdistribusi, berbagai platform komputasi
dari berbagai jenis, redundansi, dan akses bersamaan. Ini awalnya dibangun untuk proyek yang
melibatkan perayap web, agen otonom yang melintasi Internet dan membangun indeks untuk mesin
pencari web. Seperti yang dapat Anda bayangkan, jumlah halaman web dan deskriptor konten pada
halaman ini sangat banyak. Berbeda dengan database relasional yang sangat terstruktur,
data pada konten web cenderung memiliki sedikit interkoneksi dan struktur sederhana yang oleh
sebagian orang disebut datar. Dalam situasi seperti itu, memberikan beberapa hasil dengan cepat
lebih penting daripada memberikan jawaban yang paling komprehensif secara perlahan.
Sebuah model grafis dari arsitektur Hadoop ditunjukkan pada Gambar 4-4. NameNode bertanggung
jawab untuk mereplikasi data dan melacak tempat item data disimpan. Replikasi data mendukung
toleransi kesalahan dan integritas.
Gambar 4-7 Arsitektur Hadoop
Hadoop melibatkan tahap yang disebut peta-reduksi, di mana data pertama dipetakan untuk
menemukan data umum dan lalu dikurangi sesuai dengan bagian umum. Hadoop lalu
mendukung pemakai an terdistribusi dari data yang dikurangi itu. Komputasi tidak memerlukan
biaya apa pun saat mesin dalam keadaan idle; yaitu, mesin yang dipakai 85 persen dari waktunya
memiliki 15 persen waktu tidak terpakai yang dapat dipakai tanpa biaya tambahan. Pendekatan
Hadoop menggerakkan komputasi di lingkungan terdistribusi untuk memanfaatkan sumber daya
komputasi yang kurang dimanfaatkan.
312
Model Hadoop dikembangkan untuk lingkungan data terbuka yang dibagikan oleh semua orang.
Dengan demikian, ia tidak memiliki mekanisme untuk kontrol akses, pemeriksaan kebenaran,
privasi, identifikasi atau otentikasi pemakai , pencatatan tindakan, atau hak istimewa terbatas—
semua primitif yang mungkin Anda harapkan di lingkungan aman apa pun. Model keamanan awal
yaitu pemisahan total: Big data diproses di lingkungan yang terpisah dan tepercaya oleh hanya
pemakai tepercaya pada mesin khusus. Model pemakai an ini mirip dengan instalasi komputasi
mainframe paling awal (1940-an–50-an) dan dengan niat asli (1960-an–70-an) untuk sistem operasi
Unix: Lingkungan tertutup di mana semua pemakai tahu dan mempercayai semua orang lain
dan tidak perlu mengecualikan beberapa pemakai dari beberapa data. Seiring waktu, desainer
menerapkan keamanan untuk komputer mainframe dan Unix, meskipun menambahkan keamanan
itu menantang.
Big data menimbulkan masalah keamanan sebab jumlah data yang dipertimbangkan: Melindungi
puluhan atau ratusan item data umumnya melibatkan lebih sedikit risiko dan kesulitan daripada
miliaran atau triliunan. Namun, banyak masalah perlindungan yang sama seperti di domain lain:
Mengamankan data, melindungi privasi, dan memastikan integritas yaitu masalah untuk komputer
pemakai tunggal, sistem komputasi multipemakai , jaringan, penyedia cloud, dan aplikasi
terdistribusi, serta big data prosesor.
Di bagian ini kami mencantumkan masalah keamanan dalam big data, sering kali hanya menunjukkan
bahwa masalah ini merupakan contoh dari masalah keamanan yang lebih umum yang muncul
di bagian lain buku ini. Dan sebab big data yaitu bidang yang baru muncul, kami mencantumkan
masalah dan bukan solusi. Dari contoh otorisasi, kontrol akses, dan sejenisnya yang ditunjukkan di
tempat lain dalam buku ini, Anda dapat mengusulkan alat dan teknik yang berlaku untuk masalah
ini.
Privacy
Orang dapat berargumen bahwa big data tidak terkait dengan privasi: Pemroses data tidak
mengumpulkan data namun hanya menyaring data yang ada. Jadi, misalnya, pemakai big data
tidak bertanggung jawab atas fakta bahwa sebuah toko melacak pembelian pelanggan melalui kartu
loyalitas pelanggan atau bahwa toko ini lalu menjual data pelacakan ini kepada
orang-orang yang tertarik untuk mempelajari tren. Di sisi lain, kemampuan pengumpulan dan korelasi
big data telah memungkinkan pemakai an seperti itu dan bahkan menguntungkan. Terlepas dari
itu, masalah privasi muncul. Kami mempelajari privasi secara umum di Bab 5.
Privacy-Preserving Analytics
Anonimisasi yaitu metode penting untuk menyeimbangkan masalah privasi dengan tujuan
fungsional. Para peneliti ingin tahu, misalnya, apakah merokok berkorelasi dengan kanker paru-
paru. Untuk mempelajarinya, peneliti membutuhkan populasi yang terdiri dari perokok dan bukan
perokok, beserta status kanker paru-paru mereka. Siapa subjeknya tidak penting. Secara teori,
kumpulan besar sejarah kasus membuatnya tidak mungkin untuk menghubungkan subjek dengan
identitas yang sebenarnya. Dalam hal itu, big data harus meningkatkan privasi dengan meningkatkan
kumpulan subjek secara signifikan, sehingga meningkatkan jumlah subjek dan identitas.
Sayangnya, big data juga berkontribusi pada masalah sebab menyediakan lebih banyak data yang
dapat mengidentifikasi individu tertentu: Lebih banyak istilah data mengurangi jumlah orang yang
313
cocok dengan semua atribut. Siapa pasien kanker yang tinggal di Maple Street, 55 tahun, di rumah
dengan dua anjing, berlangganan majalah Bicycling, yang sering menelepon ke Rio de Janeiro?
Seperti yang dijelaskan sebelumnya dalam bab ini, menambahkan noise dan menghapus data
pengenal dapat membantu menjaga privasi. Kebisingan mungkin termasuk data palsu: satu kucing
dan tidak ada anjing, misalnya; menghapus usia mungkin juga mempersulit untuk menyimpulkan
identitas orang ini dari data. Namun, pendekatan yang membatasi data yaitu solusi yang
tidak lengkap.
Kontrol Akses Granular (Granular Access Control)
Big data sering memakai kumpulan data tidak terstruktur, datar, Tabel dua dimensi. Kontrol
akses, jika ada, dikenakan pada tingkat file: Seluruh file dapat atau tidak dapat diakses oleh pemakai .
Pendekatan seperti itu sangat cocok dengan arsitektur big data seperti Hadoop, di mana seluruh
file direplikasi dan dianalisis oleh kumpulan DataNodes yang bekerja secara paralel.
Seperti yang pertama kali diangkat di Bab 2 dan diperkuat di sepanjang sisa buku ini, kontrol akses
yang halus membantu meningkatkan keamanan (dan privasi) dengan mengizinkan hak istimewa
paling rendah: Sebuah proses hanya dapat mengakses objek-objek ini atau data spesifik yang
konsisten dengan kebijakan keamanan dan diperlukan untuk tugas yang ada.
Keamanan (Security)
Keamanan data yaitu tantangan utama kedua dari arsitektur big data. Pertimbangkan kembali triad
C-I-A dari Bab 1. Kerahasiaan terkait erat dengan privasi, namun ada masalah kerahasiaan lainnya.
Big data sering kali melibatkan uang besar: Pengumpul data membayar untuk memanen data yang
lalu mereka jual. Pemanen data menuai keuntungan berkelanjutan dengan mengumpulkan
data sekali dan menjualnya berkali-kali ke pembeli yang berbeda. Perusahaan penelusuran seperti
Google mengumpulkan data dari istilah penelusuran pemakai (seperti “hotel San Francisco”)
yang lalu dapat mereka jual ke Hilton, Marriott, dan Sheraton, serta maskapai penerbangan,
restoran, perusahaan tur, dan sebagainya. Jika Google menjual data ke Hilton dan Hilton lalu
menjualnya kembali ke Marriott dan lainnya, Google kehilangan aliran pendapatan berikutnya.
Dengan demikian, Google ingin mengontrol kerahasiaan data miliknya. Integritas data — bahwa itu
benar dan utuh — penting, seperti halnya memastikan ketersediaan data. Dengan demikian, ketiga
elemen dari triad penting untuk big data.
Di sini kami mencantumkan beberapa masalah keamanan big data.
Secure Data Storage
Dalam model Hadoop, item data direplikasi dan disimpan di lokasi yang nyaman. Jika satu
penyimpanan data menjadi sangat penuh sehingga kinerjanya menurun, pengontrol secara otomatis
membagi data dan memindahkan beberapa data ke tempat lain. Pengembang aplikasi umumnya
tidak tahu, apalagi peduli, di mana data disimpan secara fisik.
Penyedia penyimpanan data mencari biaya terendah, dan hosting data di pusat Kota New York,
London, atau Tokyo kemungkinan akan jauh lebih mahal daripada Alcoa, Tennessee, atau Pateley
314
Bridge, Inggris. Dengan daya dan infrastruktur jaringan yang memadai, tempat mana pun sama
bagusnya dengan tempat lain.
Hampir. Misalkan data disimpan di wilayah yang sensitif secara politik, bahkan zona perang: Serangan
mortir atau dampak dari serangan rudal tidak diinginkan. Atau misalkan data disimpan di negara
yang penguasanya memutuskan untuk menasionalisasi semua aset asing. Atau pertimbangkan
lokasi di mana warga yang lapar menyerbu instalasi untuk mencuri apa pun yang nantinya dapat
mereka jual kembali sebagai barang bekas untuk membeli makanan. Dalam bab lain kami telah
menjelaskan kontrol akses dalam hal kartu magnetik dan pembaca sidik jari untuk orang yang sopan,
namun kontrol akses secara global juga harus menangani masalah fisik dan politik.
Log Transaksi dan Audit
Log aktivitas penting untuk memantau siapa yang melakukan apa. Tinjauan log audit dapat membantu
administrator mengatur izin akses, dan log juga membantu menentukan tingkat kerusakan jika
terjadi kesalahan atau pelanggaran keamanan. Namun, menentukan apa yang akan dilacak itu
sulit: Pelacakan yang terlalu sedikit dapat membatasi kegunaan log akses, namun terlalu banyak
data dapat membebani manusia dan teknologi, sehingga sulit untuk menemukan jarum pepatah
di tumpukan jerami akses. Granularitas data memengaruhi volume data pelacakan. Mungkin tidak
ada gunanya mengetahui bahwa pemakai A mengakses database D pada hari Senin, saat yang
akan sangat membantu yaitu mengetahui bahwa A memodifikasi catatan 2 dan 17, atau bahkan A
mengubah bidang alamat di 2, dan bidang gaji 14. data pelacakan yang tersedia bergantung pada
perincian akses yang direkam untuk data ini .
Dalam aplikasi big data, unit akses sering berupa file, jadi log hanya akan mencatat bahwa aplikasi
mengakses file F, bukan data spesifik dalam F.
Pemantauan Keamanan Real-time
Seperti dijelaskan dalam Bab 6, deteksi intrusi, dan sistem perlindungan memungkinkan administrator
untuk memantau aktivitas, mungkin mendeteksi perilaku atau serangan anomali, dan menerapkan
tindakan pencegahan saat insiden sedang berlangsung. Arsitektur big data melibatkan pergerakan
data dan komputasi yang gesit, namun jaringan penghubung mungkin berupa jaringan bersama yang
besar, seringkali Internet. Pemantauan keamanan waktu nyata tidak dimaksudkan untuk arsitektur
jaringan yang kompleks, dibagi, dan lancar.
Integritas
Akhirnya, integritas layak mendapat pertimbangan tersendiri terpisah dari kerahasiaan dan
ketersediaan, sebab kebenaran, akurasi, dan keandalan sangat penting bagi pemakai data. Di
bagian ini kami mengidentifikasi beberapa masalah integritas yang relevan untuk big data.
Akurasi Data
Anda mungkin pernah mengalami beberapa bagian data pribadi yang salah dimasukkan ke dalam
database. Kami telah menyajikan contoh sebelumnya di bab 510 Thames Street ini, bukan 519.
Bagian yang membuat frustrasi yaitu , coba semau Anda, Anda sering kali tidak akan pernah bisa
melacak tempat terakhir di mana nomornya salah. Jadi 510 terus bermunculan selama bertahun-
tahun. Kami memakai contoh sebelumnya sebagai aspek integritas elemen.
315
Kumpulan big data memiliki masalah dengan integritas, seperti yang baru saja kami jelaskan. Namun,
karakteristik lain dari pemakai an big data memperumit situasi. Big data sering memakai
banyak aliran data yang dikumpulkan dari banyak sumber, misalnya, pengenalan foto pelat nomor
mobil, transkripsi manusia dari catatan publik tertulis, pengenalan suara dari rekaman, dan input
dari formulir tulisan tangan, yang semuanya rentan terhadap kesalahan.
Basis data yang kaya dan terstruktur sering kali memiliki satu atau lebih kunci pengenal, seperti
nomor telepon, nomor asuransi nasional, nomor rekening, tanggal lahir, atau beberapa item data
solid lainnya untuk menggabungkan dua kumpulan data. Kumpulan big data cenderung tidak memiliki
kunci yang kuat, sehingga mereka digabungkan pada atribut yang lebih lemah, seperti nama (yang
dapat disajikan dalam beberapa bentuk dan salah eja dalam lebih banyak cara). Keakuratan hasil
dari gabungan ini lebih rendah.
Untuk banyak kegunaan, akurasi tinggi big data tidak penting: Apakah 90, 100, atau 110 orang dari
500 di lingkungan memiliki hewan peliharaan kurang penting daripada kepemilikan hewan peliharaan
dalam kisaran 15 persen hingga 25 persen. Namun, pemakai perlu menghargai tingkat akurasi
yang terbatas ini.
Sumber Asal (Source Provenance)
Big data biasanya melibatkan pengumpulan dan analisis data dari beberapa sumber. Seperti yang
baru saja kami tunjukkan, kumpulan data akan memiliki tingkat kualitas yang berbeda tergantung
dari mana data itu berasal. Aplikasi big data harus mengontrol variabilitas ini , meskipun model
big data tidak selalu memberikan aplikasi cara untuk mempelajari sumber data yang tepat, atau
bahkan sifat sumbernya. Dengan demikian, penulis aplikasi tidak dapat dengan mudah menjelaskan
asal data dalam hasil yang mereka hasilkan.
Pemfilteran End-point dan Validasi
Terakhir, setelah aplikasi memproses data dari kumpulan big data, aplikasi mungkin ingin memfilter
dan memvalidasi hasilnya. Kerangka kerja big data saat ini tidak mendukung revisi dan manipulasi
data semacam itu.
Tambahan Keamanan untuk Aplikasi Big Data
Seperti yang dijelaskan dalam bab lain, menambahkan keamanan ke produk atau sistem yang
ada jarang merupakan strategi yang berhasil. Namun demikian, terkadang itu yaitu satu-satunya
pendekatan yang tersedia; tidak hanya spesifikasi dan desainnya yang lengkap, namun satu atau lebih
versi produk sedang dipakai . Seperti halnya dengan Hadoop dan kerangka kerja aplikasi big data
berpemilik lainnya: Desain dan implementasi produk selesai sebelum keamanan dipertimbangkan
secara serius. Insinyur keamanan sekarang telah merekomendasikan perubahan dan penambahan
pada Hadoop untuk mendukung alat dan teknik keamanan yang terkenal.
Mode aman Hadoop dijelaskan di situs web Hadoop https://hadoop.Apache.org/docs/current/hadoop-
project-dist/hadoop-common/SecureMode.html dan dalam buku putih [OMA09] dari Yahoo! Tim,
dipimpin oleh Owen O'Malley. Proposal untuk fungsi keamanan ini menyarankan fitur keamanan
untuk disertakan dalam kerangka Hadoop. Buku putih mengidentifikasi dua lubang keamanan untuk
diatasi: kurangnya otentikasi pemakai (dan identifikasi) dan kurangnya kontrol akses ke blok data.
316
Untuk mengatasi kesalahan ini, tim mengusulkan mode aman yang melibatkan ekstensi berikut ke
Hadoop:
• otentikasi untuk perangkat web pemakai akhir
• otentikasi timbal balik (pemakai –proses–layanan Hadoop) dengan Kerberos
• kontrol akses ke file dalam sistem file Hadoop
• token delegasi untuk otentikasi berkelanjutan antara klien internal dan layanan internal
• token pekerjaan untuk mendistribusikan otorisasi akses ke beberapa platform terdistribusi yang
secara kolektif menerapkan pencarian data di seluruh penyimpanan data yang berbeda
• Enkripsi SSL untuk lalu lintas jaringan
Kekuatan pendorong dalam desain ini yaitu kinerja: Pengembang memutuskan bahwa fungsi
keamanan tidak dapat mengurangi kinerja lebih dari 3 persen. Pada tahun 2008, Yahoo! jaringan
pengembang melaporkan bahwa cluster Hadoop telah berhasil mengurutkan satu terabyte data
dalam 209 detik. Perhatikan bahwa untuk melindungi data, tim O'Malley tidak mau memperlambat
hasil itu dengan waktu yang lebih singkat daripada yang Anda perlukan untuk membaca kalimat ini.
(209 detik mengalahkan rekor sebelumnya 297 detik, pengurangan lebih dari 26 persen.)
Andrew Becherer mempresentasikan makalah [BEC10] di BlackHat 2010 yang mencatat beberapa
kekurangan ekstensi keamanan Hadoop tahun 2009. Dia mengkritik tingkat perlindungan default,
diukur dengan kekuatan kriptografi yang dipakai secara default bagi pemakai yang memilih
untuk memakai keamanan perangkat tambahan. Lebih jauh, dia menunjukkan bahwa desainnya
melibatkan pendistribusian kunci yang sama ke ratusan atau ribuan server yang berpotensi di lokasi
terdistribusi. Jumlah besar salinan dari kunci yang sama meningkatkan risiko bahwa satu salinan
kunci mungkin jatuh ke tangan penyerang. Model keamanan juga mengotentikasi proses tertentu
berdasarkan alamat IP di mana mereka (tampaknya) di-host. Seperti dijelaskan dalam Bab 6,
alamat IP dapat dipalsukan, dan kerentanan itu tidak dapat diabaikan saat sistem Hadoop di-host
di Internet.
Peningkatan keamanan untuk Hadoop jelas merupakan langkah maju yang disambut baik, namun
sebab terlalu banyak masalah keamanan yang telah kami jelaskan dalam buku ini, solusi terbatas
jika keamanan ditambahkan setelah fakta, dikorbankan untuk kinerja, dan tidak memiliki desain dan
analisis yang luas sebelum pendekatan keamanan dikodifikasi.
4.6 Kesimpulan
Dalam bab ini kita telah mengeksplorasi perlindungan data. Selain itu, kami telah meninjau beberapa
masalah keamanan komputasi awan, nama baru untuk penyimpanan dan pemrosesan data yang
didistribusikan secara luas.
Melindungi data sangat rumit sebab pemakai dapat mengumpulkan dan mengumpulkan data di
luar sistem komputasi. Jadi, meskipun kami mungkin menyiapkan pendekatan kontrol akses yang
solid dan pelacakan lengkap dari data apa yang diakses setiap individu, tindakan di luar sistem
sepenuhnya di luar kendali kami.
317
Bahan Evaluasi
1. Kerjakan soal-soal berikut ini!
(a) Dalam lingkungan di mana beberapa pemakai berbagi akses ke satu database, dapatkah
satu pemakai memblokir akses orang lain untuk jangka waktu yang tidak terbatas? (Situasi
ini disebut penundaan tidak terbatas.)
(b) Jelaskan skenario di mana dua pemakai dapat memicu penundaan tidak terbatas
satu sama lain.
(c) Jelaskan skenario di mana satu pemakai dapat memicu penundaan yang tidak
terbatas dari semua pemakai .
2. Dengan memakai komitmen dua langkah yang disajikan di awal bab ini, jelaskan bagaimana
menghindari menetapkan satu kursi untuk dua orang, seperti dalam contoh maskapai penerbangan.
Yaitu, buatlah daftar dengan tepat langkah-langkah mana yang harus diikuti oleh pengelola basis
data dalam menetapkan penumpang ke tempat duduk.
3. Misalkan seorang manajer basis data mengizinkan penyarangan satu transaksi di dalam transaksi
lainnya. Artinya, setelah memperbarui bagian dari satu catatan, DBMS akan memungkinkan Anda
untuk memilih catatan lain, memperbaruinya, dan lalu melakukan pembaruan lebih lanjut
pada catatan pertama. Apa efek bersarang pada integritas database? Sarankan mekanisme
yang memungkinkan pembuatan sarang.
4. Dapatkah database berisi dua catatan identik tanpa efek negatif pada integritas database?
Mengapa atau mengapa tidak?
5. Beberapa sistem operasi melakukan buffered I/O. Dalam skema ini, permintaan keluaran diterima
dari pemakai dan pemakai diberitahu tentang penyelesaian I/O normal. Namun, operasi tulis
fisik yang sebenarnya dilakukan lalu , pada waktu yang sesuai dengan sistem operasi.
Diskusikan efek buffered I/O pada integritas dalam DBMS.
6. Transaksi database mengimplementasikan perintah "set STATUS ke 'CURRENT' di semua
catatan di mana BALANCE-OWED = 0." (a) Jelaskan bagaimana transaksi itu akan dilakukan
dengan komit dua langkah yang dijelaskan dalam bab ini. (b) Misalkan relasi dari mana perintah
itu dibentuk yaitu (ID-PELANGGAN,STATUS) dan (ID-PELANGGAN,BALANCE-OWED).
Bagaimana transaksi akan dilakukan? (c) Misalkan hubungan dari mana perintah itu dibentuk
yaitu (ID-PELANGGAN,STATUS), (ID KREDIT,ID-PELANGGAN), (ID-KREDIT, BALANCE-
OWED). Bagaimana transaksi akan dilakukan?
4. Tunjukkan bahwa jika paritas longitudinal dipakai sebagai kode deteksi kesalahan, nilai dalam
database masih dapat dimodifikasi tanpa deteksi. (Paritas longitudinal dihitung untuk bit ke-n
dari setiap byte; yaitu, satu bit paritas dihitung dan dipertahankan untuk semua bit di posisi ke-0,
bit paritas lain untuk semua bit di posisi ke-1, dll.)
8. Misalkan kueri Q1 memperoleh median ml dari kumpulan nilai S1, dan kueri Q2 memperoleh
median m2 dari subset S2 dari S1. Jika m1 < m2, apa yang dapat disimpulkan tentang S1, S2,
dan elemen-elemen S1 yang tidak ada dalam S2?
9. Pengungkapan jumlah semua bantuan keuangan untuk siswa di asrama Smith tidak sensitif
sebab tidak ada siswa individu yang dikaitkan dengan jumlah. Demikian pula, daftar nama
siswa yang menerima bantuan keuangan tidak sensitif sebab tidak ada jumlah yang ditentukan.
Namun, kombinasi dari dua daftar ini mengungkapkan jumlah untuk seorang siswa jika hanya
318
satu siswa di asrama Smith yang menerima bantuan. Perhitungan apa yang harus dilakukan oleh
sistem manajemen basis data untuk menentukan bahwa daftar nama mungkin mengungkapkan
data sensitif? Catatan apa yang harus dipertahankan oleh sistem manajemen basis data
tentang apa yang diketahui pemakai berbeda untuk menentukan bahwa daftar nama mungkin
mengungkapkan data sensitif?
10. Salah satu pendekatan yang disarankan untuk memastikan privasi yaitu penolakan hasil kecil,
di mana sistem menolak (tidak mengembalikan hasil dari) permintaan apa pun, yang hasilnya
berasal dari sejumlah kecil, misalnya, lima catatan. Perlihatkan cara mendapatkan data sensitif
dengan hanya memakai kueri yang berasal dari enam rekaman.
11. Respon “nilai sensitif; respon ditekan” itu sendiri merupakan pengungkapan. Sarankan cara di
mana sistem manajemen basis data dapat menekan respons yang mengungkapkan informasi
sensitif tanpa mengungkapkan bahwa respons terhadap kueri tertentu bersifat sensitif.
12. Sebutkan situasi di mana sensitivitas suatu agregat lebih besar daripada nilai-nilai penyusunnya.
Mengutip situasi di mana sensitivitas agregat kurang dari nilai-nilai konstituennya.
319
Sampai saat ini masalah privacy masih menjadi pro dan kontra. Pihak pro yang diwakili oleh ahli
hukum dan masyarakat yang peduli atas hak – hak mereka, mengambil sudut pandang privasi
sebagai sebuah kekayaan intelektual atau hak milik pribadi. Pemerintah sebagai pihak yang kontra
mengedepankan alasan – alasan keamanan negara sebagai pembenaran terhadap aktivitas
pengawasan dinamika masyarakat beserta atribut informasi yang melekat padanya.
Wujud konkritnya yaitu disahkannya peraturan yang melindungi hak privasi individu. Misalnya,
Amerika Serikat memiliki antara lain Privacy Act (1974), Electronic Communications Privacy Act
(1986), dan Childrens's Online Privacy Protection (1994), sementara Uni Eropa memiliki European
Privacy Directive 8 (1998). Dampak signifikannya terhadap perlindungan privasi baru akan terasa
bilamana hukum menjadi rujukan utama dalam penanganan masalah sosial
Komputer tidak menciptakan atau bahkan memicu masalah privasi; kami memilikinya jauh
sebelum komputer dan mungkin bahkan sebelum bahasa tertulis. namun kemampuan pemrosesan
dan penyimpanan data serta transmisi berkecepatan tinggi komputer memungkinkan pengumpulan
dan korelasi data yang memengaruhi privasi. sebab privasi yaitu bagian dari kerahasiaan, itu
yaitu aspek keamanan komputer.
Kerahasiaan Privasi
Bab 5
320
Privasi yaitu hak asasi manusia, meskipun orang dapat secara sah tidak setuju tentang kapan
atau sejauh mana privasi layak; ketidaksepakatan ini mungkin memiliki akar budaya, sejarah, atau
pribadi. namun pada dasarnya, hak atas privasi bergantung pada situasi di mana privasi diinginkan,
kepemilikan dan kegigihan data, serta hak dan tanggung jawab hukum dari pihak-pihak yang terkena
dampak. Selain itu, seperti halnya kerahasiaan, integritas, dan ketersediaan dapat bertentangan,
demikian juga privasi dan aspek keamanan lainnya.
Privasi yaitu kemampuan satu atau sekelompok individu untuk mempertahankan kehidupan dan
urusan personalnya dari publik, atau untuk mengontrol arus informasi mengenai diri mereka. sebab
privasi sebagai topik lebih luas daripada implikasinya terhadap keamanan, kami membatasi diri dalam
bab ini hanya untuk masalah privasi yang terkait erat dengan keamanan komputer. Jadi, dalam bab
ini kita melihat arti dari privasi informasi. Kami meninjau kembali identifikasi dan otentikasi, dua aspek
komputasi yang sudah dikenal yang memiliki implikasi privasi yang signifikan. Kami mempelajari
bagaimana privasi berhubungan dengan Internet, khususnya dalam email dan akses web. Akhirnya,
kami menyelidiki beberapa teknologi berbasis komputer yang muncul di mana privasi penting.
Privasi yaitu kebebasan pribadi. Sebagai contoh, saat anda mengirim surat kepada teman,
tentu dengan amplop tertutup bukan? Walaupun mungkin isinya tidak penting. Mengapa anda tidak
mengirimkannya dengan kartu pos? Nah dari contoh ini, anda tentu sudah bisa menarik kesimpulan
yang intinya, anda tidak ingin orang lain membaca surat anda.
5.1 Konsep Privasi
Konsep privasi menjadi semakin penting dibicarakan di era seperti sekarang, sebab kemunculan
teknologi yang mampu merekam dan menyimpan bentuk baru dari informasi pribadi, contohnya
sidik jari, wajah dan bahkan retina mata seseorang. Proses merekam dan menyimpan ini
tidak hanya dilakukan dalam skala kecil tapi juga skala besar. Bayangkan berapa banyak pemakai
ponsel seperti iPhone yang memakai sidik jari atau pemakai Facebook yang mengidentifikasi
atau tag wajah seseorang (lihat ilustrasi di atas). pemakai an internet yang digabungkan dengan
pemakaian ponsel semakin menyebar ke berbagai lini kehidupan juga melancarkan jalan ini ,
bahkan dengan kemampuan penyebaran yang lebih luas dari yang pernah kita bayangkan.
5.1.1 Aspek- Aspek Privacy Information (Security)
Sebuah informasi harus aman, dalam arti hanya diakses oleh pihak – pihak yang berkepentingan
saja sesuai dengan sifat dan tujuan dari informasi ini . Privasi informasi memiliki tiga aspek:
data sensitif, pihak yang terpengaruh, dan pengungkapan yang terkendali. Sebenarnya, aspek-
aspek ini mirip dengan tiga elemen kontrol akses dari Bab 2: subjek, objek, dan hak akses. Kami
membahas ketiganya secara bergantian.
Pengungkapan yang Terkendali
Apa itu privasi? Definisi kerja yang baik yaitu bahwa privasi yaitu hak untuk mengontrol siapa yang
mengetahui aspek-aspek tertentu tentang Anda, komunikasi Anda, dan aktivitas Anda. Dengan kata
lain, Anda secara sukarela memilih siapa yang dapat mengetahui hal-hal apa tentang Anda. Orang
mungkin menanyakan nomor telepon Anda: montir mobil Anda, pegawai toko, otoritas pajak Anda,
321
kontak bisnis baru, atau teman baru. Dalam setiap kasus, Anda mempertimbangkan mengapa orang
ini menginginkan nomor ini dan lalu memutuskan apakah akan memberikannya.
namun poin kuncinya yaitu Anda memutuskan. Jadi privasi yaitu sesuatu di mana Anda dapat
memiliki pengaruh yang cukup besar.
Namun, Anda tidak memiliki kendali penuh. Setelah Anda memberikan nomor Anda kepada
seseorang atau suatu sistem, kendali Anda akan berkurang sebab sebagian bergantung pada apa
yang dilakukan orang atau sistem ini dengan informasi ini . Dalam memberikan nomor
Anda, Anda mentransfer atau menyerahkan otoritas dan kendali kepada seseorang atau sesuatu
yang lain. Anda dapat mengatakan "jangan berikan nomor saya kepada orang lain", "gunakan
kebijaksanaan", atau "Saya sensitif tentang privasi saya", namun Anda tidak mengontrol orang atau
sistem lain. Anda harus mempercayai orang atau sistem untuk memenuhi keinginan Anda, apakah
Anda menyatakan keinginan itu secara eksplisit atau tidak. Masalah ini mirip dengan masalah
propagasi keamanan komputer: Siapapun yang memiliki akses ke suatu objek dapat menyalin,
mentransfer, atau menyebarkan objek itu atau isinya kepada orang lain tanpa batasan. Dan bahkan
jika Anda menentukan bahwa objek ini harus dihapus atau dihancurkan setelah jangka waktu
tertentu, Anda tidak memiliki cara untuk memverifikasi bahwa sistem atau orang ini benar-
benar menghancurkan konten ini .
Data Sensitif
Seseorang menanyakan ukuran sepatu Anda. Anda dapat menjawab, “Saya orang yang sangat
tertutup dan tidak dapat membayangkan mengapa Anda ingin mengetahui detail yang begitu intim” atau
Anda dapat mengatakan “10C”; beberapa orang menemukan bahwa item data lebih sensitif daripada
yang lain. Beberapa informasi biasanya dianggap sensitif, seperti status keuangan, data kesehatan
tertentu, kejadian buruk di masa lalu seseorang, dan sejenisnya. Jadi, jika Anda mempelajari sesuatu
yang Anda anggap sensitif tentang seseorang, Anda cenderung merahasiakannya, kecuali jika ada
argumen yang kuat untuk mengungkapkannya. Misalnya, di banyak tempat, profesional kesehatan
(tertarik pada identifikasi penyakit, penahanan, dan pencegahan) diwajibkan untuk melaporkan
contoh penyakit yang sangat menular atau mematikan, bahkan jika orang yang terkena tidak ingin
informasi itu dipublikasikan. namun kebanyakan dari kita tidak terlalu sensitif tentang ukuran sepatu
kita, jadi kita biasanya tidak melindungi informasi itu jika ditanya, atau jika kita mempelajarinya
tentang orang lain. Dalam kebanyakan kasus, kami menghormati permintaan untuk melindungi
informasi sensitif seseorang.
Berikut yaitu contoh (tanpa urutan tertentu) jenis data yang dianggap pribadi oleh banyak
orang.
• Identitas: nama, informasi identitas, kepemilikan data pribadi dan kemampuan untuk mengontrol
pengungkapannya
• Komunikasi istimewa: dengan para profesional seperti pengacara, akuntan, dokter, konselor,
dan pendeta
• Kesehatan: kondisi medis, pemakai an narkoba, DNA, kecenderungan genetik terhadap
penyakit
• Informasi akademik dan pekerjaan: catatan sekolah, peringkat pekerjaan
• Keuangan: peringkat dan status kredit, detail bank, pinjaman terutang, catatan pembayaran,
informasi pajak
322
• Pendapat, preferensi, dan keanggotaan: catatan pemungutan suara, pendapat yang diungkapkan,
keanggotaan dalam organisasi advokasi, agama, partai politik, preferensi seksual, kebiasaan
membaca, penjelajahan web, hiburan favorit, teman dekat
• Hukum: catatan kriminal, riwayat pernikahan, gugatan perdata
• Biometrik: karakteristik fisik, hasil poligraf, sidik jari
• Bukti dokumenter: surat permukaan, buku harian, puisi, korespondensi, pemikiran yang
direkam
• Data lokasi: rencana perjalanan umum, lokasi saat ini, pola perjalanan
• Jejak digital: email, panggilan telepon, spam, pesan instan, tweet, dan bentuk interaksi elektronik
lainnya, riwayat jejaring sosial
Privasi juga dipengaruhi oleh siapa Anda. saat Anda berada di sebuah ruangan dengan orang yang
tidak Anda kenal, mungkin di resepsi, seseorang mungkin mendatangi Anda dan berkata, “Jadi, Anda
yaitu orang yang membuat kue yang indah di sana; Saya sangat menghargai keahlian Anda sebagai
koki kue.” Senang rasanya mendapat pengakuan seperti itu. Sebaliknya, jika Anda seorang penyiar
berita di televisi lokal setiap malam, Anda mungkin lebih suka makan malam di rumah daripada
pergi ke restoran; Anda mungkin bosan dengan orang asing yang terburu-buru untuk mengatakan,
"Saya melihat Anda sepanjang waktu di TV." (Banyak tokoh publik menghargai sedikit privasi
yang mereka pertahankan.) Atlet juara dunia tidak dapat menghindari hasil mereka dipublikasikan,
sedangkan Anda mungkin tidak ingin semua orang tahu seberapa buruk Anda menyelesaikan
pertandingan atletik terakhir Anda. Budaya juga mempengaruhi apa yang orang anggap sensitif;
misalnya, mendiskusikan hubungan seksual atau informasi gaji mungkin diperbolehkan di satu
budaya namun tidak di budaya lain.
Secara umum, ekspektasi privasi seseorang bergantung pada konteks: siapa yang terpengaruh,
bagaimana perasaan orang ini tentang publisitas, dan norma privasi yang berlaku.
Subyek yang Membutuhkan Privasi
Individu, grup, perusahaan, organisasi, dan pemerintah semuanya memiliki data yang mereka anggap
sensitif. Kami memakai istilah seperti "subjek" dan "pemilik" untuk membedakan antara orang
atau entitas yang dijelaskan oleh data dan orang atau entitas yang menyimpan data. Sejauh ini kami
telah mengGambarkan privasi dari sudut pandang pribadi, di mana subjeknya yaitu seseorang.
namun organisasi publik dan swasta juga tertarik pada privasi. Perusahaan mungkin memiliki data
yang mereka anggap pribadi atau sensitif: rencana produk, pelanggan utama, margin keuntungan,
dan teknologi yang baru ditemukan, sebagai contoh. Untuk perusahaan swasta, privasi biasanya
berkaitan dengan mendapatkan dan mempertahankan keunggulan dalam persaingan. Organisasi
lain, seperti sekolah, rumah sakit, atau badan amal, mungkin perlu melindungi data pribadi tentang
siswa, pasien, atau donor mereka. Banyak organisasi juga melindungi informasi yang terkait dengan
reputasi mereka; mereka mungkin ingin mengontrol berita negatif atau waktu rilis informasi yang
dapat mempengaruhi harga saham atau keputusan hukum. Sebagian besar pemerintah menganggap
masalah militer dan diplomatik sensitif, namun mereka juga mengakui tanggung jawab mereka untuk
memberikan informasi yang menginformasikan wacana nasional. Pada saat yang sama, pemerintah
memiliki tanggung jawab untuk melindungi dan menjaga kerahasiaan data yang mereka kumpulkan
dari warga negara, seperti informasi pajak.
323
Privasi yaitu aspek kerahasiaan. Seperti yang telah kita pelajari di seluruh buku ini, tiga tujuan
keamanan kerahasiaan, integritas, dan ketersediaan dapat bertentangan, dan kerahasiaan terkadang
bertentangan dengan ketersediaan. Misalnya, jika Anda memilih untuk tidak mencantumkan nomor
telepon Anda dalam direktori, maka beberapa orang mungkin tidak dapat menghubungi Anda melalui
telepon. Atau menolak untuk mengungkapkan data pribadi ke toko dapat mencegah Anda menerima
diskon yang sering berbelanja. Jadi, penting untuk mempertimbangkan privasi tidak hanya sebagai
cara untuk melindungi informasi namun juga sebagai penghalang yang mungkin untuk tujuan penting
dan positif lainnya.
5.1.2 Masalah Privasi dalam Program Komputer
Anda mungkin memperhatikan bahwa banyak jenis data sensitif dan banyak poin tentang privasi
tidak ada hubungannya dengan komputer. Anda benar sekali: Sensitivitas dan masalah ini sudah
ada sebelum komputer. Komputer dan jaringan hanya memengaruhi kelayakan, kecepatan, dan
jangkauan beberapa pengungkapan yang tidak diinginkan. Kantor arsip publik telah lama terbuka bagi
orang untuk mempelajari data yang disimpan di sana, namun kapasitas penyimpanan dan kecepatan
komputer telah memberi kita kemampuan untuk mengumpulkan, mencari, dan menghubungkan
lebih cepat dan lebih efektif daripada sebelumnya. Dengan mesin pencari, kita dapat menemukan
satu item data dari miliaran, setara dengan menemukan satu lembar kertas dari gudang yang penuh
dengan kotak kertas. Selain itu, keterbukaan jaringan dan portabilitas teknologi (seperti laptop, tablet,
ponsel, dan perangkat berkemampuan WiFi) telah sangat meningkatkan risiko pengungkapan yang
memengaruhi privasi.
Rezgui dkk. membuat daftar delapan dimensi privasi (khususnya terkait dengan web, meskipun
definisi terbawa secara alami ke jenis komputasi lainnya).
• Pengumpulan informasi: Data dikumpulkan hanya dengan pengetahuan dan persetujuan
eksplisit.
• pemakai an informasi: Data hanya dipakai untuk tujuan tertentu tertentu.
• Penyimpanan informasi: Data disimpan hanya untuk jangka waktu tertentu.
• Pengungkapan informasi: Data diungkapkan hanya kepada sekelompok orang yang
berwenang.
• Keamanan informasi: Mekanisme yang tepat dipakai untuk memastikan perlindungan
data.
• Kontrol akses: Semua mode akses ke semua bentuk data yang dikumpulkan dikendalikan.
• Pemantauan:Semua Logs (catatan) dipertahankan untuk menunjukkan semua akses ke data.
• Perubahan kebijakan: Kebijakan yang tidak terlalu ketat tidak pernah diterapkan setelah fakta
pada data yang sudah diperoleh.
Berikut yaitu masalah privasi yang muncul melalui pemakai an komputer.
Pengumpulan data (Data Collection)
Seperti yang telah kami katakan, kemajuan dalam penyimpanan komputer memungkinkan untuk
menyimpan dan memanipulasi sejumlah besar catatan. Disk pada perangkat konsumen biasa
diukur dalam gigabyte (109 atau 1 miliar byte), terabyte (1012 atau 1 triliun byte), petabyte (1015
atau 1 kuadriliun byte) dan exabyte (1018 atau 1 triliun byte). Pada 2012, Ngo [NGO12] melaporkan
bahwa Seagate mencapai tonggak sejarah dalam kepadatan penyimpanan: satu terabyte per inci,
324
memungkinkan produksi hard drive 60-terabyte. Plafke [PLA13] menyoroti tim dari Pusat Mikro-
Fotonik Swinburne University yang “telah mengembangkan teknik yang dapat meningkatkan kapasitas
penyimpanan DVD dari standar 4,7 gigabyte (GB) hingga 1 petabyte (PB). Tekniknya tidak mengubah
ukuran atau bentuk cakram, melainkan mengubah laser yang dipakai untuk membaca data
cakram.” Dan Solar [SOL10] melaporkan bahwa alternatif media elektronik menjanjikan perangkat
penyimpanan yang lebih besar. Dia menggambarkan sebuah kelompok di Chinese University of
Hong Kong yang berhasil memakai bakteri umum sebagai perangkat penyimpanan yang
aman. “Berdasarkan prosedur yang diuji, mereka memperkirakan kemampuan untuk menyimpan
sekitar 900.000 gigabyte dalam satu gram sel bakteri. Itu setara dengan 450 hard drive, masing-
masing berkapasitas 2 terabyte (2000 GB).” Untuk menempatkan angka-angka ini dalam perspektif,
pertimbangkan bahwa para ilmuwan memperkirakan kapasitas otak manusia antara satu terabyte
dan satu petabyte.
Pada saat yang sama kemampuan kita untuk menyimpan data berkembang, demikian juga jumlah
data yang ingin kita simpan. IBM memberi tahu kita bahwa 2,5 exabyte data baru dibuat setiap hari.
Statistik itu menakjubkan; itu berarti "bahwa 90% dari data di dunia saat ini telah dibuat dalam dua
tahun terakhir saja." (http://www-01.ibm.com/software/data/bigdata/what-is-big-data.html)
Pusat Superkomputer San Diego memiliki penyimpanan online sebesar satu petabyte dan arsip
offline sebesar tujuh petabyte, dan perkiraan data yang disimpan Google juga berada dalam kisaran
beberapa petabyte. Sedangkan ruang fisik terbatas menyimpan (dan menemukan) sejumlah besar
data tercetak, data elektronik mengambil sedikit ruang relatif terhadap hard copy.
Storageservers.com (http://storageservers.wordpress.com/2013/07/17/facts-and-stats-of-worlds-
largest-data-centers/) memperkirakan kapasitas dan pemakai an berikut di situs yang sudah
dikenal:
• Google memiliki 17 pusat data pada tahun 2014, terhitung 0,01 persen dari total pemakai an
energi dunia.
• Server Facebook memproses sekitar 2,4 miliar keping konten dan 750 terabyte data setiap
hari, dan pemakai nya mengakses sekitar 7 petabyte penyimpanan foto setiap bulan.
• Server Amazon memiliki lebih dari 17 juta pengunjung bulanan yang mengakses 410 terabyte
data dari platformnya. “Sekitar 30 juta pemakai Amazon melakukan streaming sekitar 40
petabyte video per bulan.”
• Microsoft memiliki lebih dari satu miliar pemakai dan lebih dari 100.000 server.
Pemberitahuan dan Persetujuan (Notice and Consent)
Dari mana semua byte ini berasal? Meskipun beberapa berasal dari sumber publik dan komersial
(seperti surat kabar, halaman web, audio digital, dan rekaman video) dan lainnya berasal dari
transfer data yang disengaja (misalnya, pengembalian pajak, pernyataan kepada polisi setelah
kecelakaan, formulir survei pembaca). , kertas sekolah), yang lain dikumpulkan tanpa pengumuman.
Perusahaan telepon mencatat tanggal, waktu, durasi, sumber, dan tujuan setiap panggilan telepon.
ISP melacak situs yang dikunjungi. Beberapa situs menyimpan alamat IP setiap pengunjung situs
(walaupun alamat IP biasanya tidak unik untuk individu tertentu). pemakai belum tentu mengetahui
kategori pengumpulan data ketiga ini dan dengan demikian tidak dapat dikatakan telah memberikan
persetujuan atas pengumpulan data ini .
325
Kami dapat diinformasikan tentang pengumpulan dan pemakai an data dalam banyak cara.
Misalnya, masuk ke situs web mungkin memerlukan pengakuan “ketentuan pemakai an”, yang
menjelaskan apa yang dikumpulkan, mengapa, dan jalan apa yang Anda miliki jika memilih untuk
tidak mengumpulkan sesuatu. Ketentuan pemakai an juga dapat memberi tahu apa yang dapat
dilakukan jika menemukan kesalahan atau ketidaksesuaian dalam mengumpulkan, menyimpan,
atau memakai data. Demikian pula, saat memakai aplikasi di perangkat seluler, mungkin
diberi tahu bahwa beberapa item data, seperti lokasi atau daftar kontak, akan dipakai oleh aplikasi
dalam melakukan beberapa tugas.
Selain pemberitahuan, persetujuan terkadang diperlukan. Artinya, Anda secara eksplisit dimintai
izin untuk mengumpulkan dan memakai informasi. Misalnya, program atau aplikasi pemetaan
mungkin meminta izin Anda untuk mengumpulkan lokasi secara otomatis; jika menolak, Anda tidak
dapat melanjutkan memakai program, atau harus memasukkan lokasi setiap kali menginginkan
peta atau petunjuk arah. Pemberitahuan dan persetujuan yaitu prinsip penting dalam penyediaan
dan perlindungan privasi. Namun, terkadang masalah dengan pemberitahuan dan persetujuan tidak
terlihat seperti yang seharusnya atau seharusnya. Studi Kasus 5-1 menjelaskan peristiwa baru-baru
ini di mana toilet di sebuah pusat konvensi diklaim dapat menangkap informasi untuk kepentingan
publik. Meski akhirnya terungkap sebagai hoax, aksi ini mengingatkan kita semua bahwa data
seringkali diambil tanpa izin dan bahkan tanpa sepengetahuan kita.
Studi Kasus 5-1 : Sensor Toilet Tanpa Persetujuan?
Itu di berita malam di Amerika Serikat dan di tempat lain: Pada konferensi internasional
tentang komputer dan interaksi manusia yang berlangsung di Toronto, pemakai
toilet disambut oleh tanda yang ditunjukkan pada Gambar 5-1. Ini memberi tahu
pemakai bahwa perilaku di toilet sedang direkam untuk dianalisis.
Gambar 5-1 Notifikasi Pengambilan Data
Pengunjung ke URL yang disediakan, quantifiedtoilets.com, diberitahu, “Kami
bangga menjadi bagian dari Inisiatif Bangunan Sehat Toronto, dan bersemangat
untuk menyebarkan infrastruktur awal di seluruh struktur sipil utama kota. Bersama
dengan mitra kami, kami memanfaatkan big data yang dikumpulkan dari aktivitas
sehari-hari bangunan dan penghuninya. Diakui bukan sumber data terseksi, kami
menganalisis proses limbah biologis bangunan untuk membuat ruang yang lebih baik
dan orang yang lebih bahagia. Kami memakai data ini untuk merampingkan
jadwal kru pembersihan, menginformasikan kotamadya tentang pemakai an sumber
daya, dan membantu bangunan dan kota merencanakan untuk warga yang lebih
sehat dan lebih bahagia ... memakai teknologi penginderaan canggih dan
sistem pengumpulan data limbah terpusat yang canggih, kami dapat diam-diam
menangkap data dari setiap toilet individu. Aktivitas di setiap toilet menciptakan
326
tanda tangan unik yang memungkinkan kami melacak pemakai an dan menganalisis
detail dari setiap toilet di sebuah gedung. Perangkat lunak inovatif kami lalu
dapat membuat katalog data untuk analisis kesehatan multifaset yang saat ini tidak
tersedia melalui cara tradisional.” Situs web ini juga menunjukkan umpan data
langsung, yang ditunjukkan pada Gambar 5-2, yang menunjukkan jenis analisis apa
yang sedang dilakukan.
Gambar 5-2 Contoh Pengambilan Data
Mengapa ini Hoaks? Salah satu pelaku menjelaskan bahwa, “Data wajah kami
tersedia secara gratis untuk ditangkap kamera CCTV setiap hari… Data lain apa
yang kami berikan tanpa benar-benar memikirkannya yang dapat dipakai
dengan cara yang cukup invasif atau tidak etis?” Meskipun sensor toilet Toronto
tidak nyata (belum?), teknologi lain yang dipakai dapat menangkap informasi
pribadi. Misalnya, sistem IntelliMat dari Tactonic Technologies (http://www.tactonic.
com/index.html) memiliki permukaan peka tekanan untuk menangkap detail tentang
cara seseorang berjalan melintasinya. Seperti yang kita lihat di Bab 2, gaya berjalan
seseorang dapat dipakai sebagai biometrik untuk mengidentifikasi siapa yang
hadir, di mana, dan kapan.
Pengumpulan data ini, bahkan jika disetujui oleh kebanyakan orang sebab
kepentingan publik yang jelas, menghadirkan masalah serius untuk pemberitahuan
dan persetujuan. Bagaimana seharusnya seseorang diberi tahu setiap kali Gambar
diambil, gaya berjalan dikenali, atau kehadiran bahan kimia dicatat? Dalam pengaturan
seperti toilet, di mana ada harapan privasi, seberapa sering pemberitahuan harus
diberikan, dan dalam berapa banyak bahasa? Bagaimana seseorang bisa memilih
keluar? Mungkin sulit atau tidak mungkin.
5.1.3 Kontrol dan Kepemilikan Data
Dalam banyak kasus, Anda diminta untuk memberikan data (dengan pemberitahuan yang tepat)
dan Anda setuju untuk melakukannya, secara eksplisit atau implisit. Tapi apa yang terjadi saat
data ditransfer ke orang atau sistem yang meminta? Setelah mengumpulkan data dengan izin Anda,
orang lain dapat menyimpan data yang Anda berikan kepada mereka; Anda telah menyerahkan
kendali (dan terkadang kepemilikan, tergantung pada hukum di wilayah Anda) atas salinan data
ini kepada mereka. Misalnya, saat Anda memesan barang dagangan secara online, Anda
tahu bahwa Anda baru saja merilis nama, alamat, data pembayaran, dan deskripsi barang yang Anda
beli. Demikian pula, saat Anda memakai kartu loyalitas pelanggan di toko atau online, Anda
tahu bahwa pedagang dapat mengaitkan identitas Anda dengan barang-barang yang Anda telusuri
327
atau beli. Setelah mengambil data Anda, pedagang lalu dapat menyimpan data tanpa batas
waktu, serta mendistribusikan kembali data ini ke orang atau sistem lain. Kebiasaan menjelajah,
praktik pembelian, dan preferensi Anda untuk merek hotel, jenis kamar hotel, maskapai penerbangan,
atau agen perjalanan dapat dijual ke hotel lain. Anda memiliki sedikit kendali atas penyebaran
(atau penyebaran ulang) data Anda. Dan begitu datanya hilang, Anda tidak bisa mendapatkannya
kembali.
Kami tidak selalu menghargai konsekuensi dari kehilangan kendali ini. Misalkan pada saat marah
Anda melontarkan nada yang kuat kepada seseorang. Meskipun 100 tahun yang lalu Anda akan
menulis catatan di atas kertas dan 50 tahun yang lalu Anda dapat menyuarakan komentar melalui
telepon, sekarang Anda memposting pesan ini ke halaman media sosial. Jika Anda berubah
pikiran dan ingin menarik kembali komentar marah Anda, pertimbangkan bagaimana Anda akan
menangani ketiga bentuk komunikasi ini. Untuk catatan tertulis, Anda menulis surat permintaan
maaf, penerima Anda merobek catatan Anda, dan tidak ada jejak yang tersisa. (Anda bahkan
mungkin dapat meyakinkan operator pos untuk mengembalikan surat Anda sebelum dikirimkan,
jadi tidak perlu meminta maaf dan tidak ada kerugian yang dilakukan.) Dalam kasus kedua, Anda
menelepon untuk meminta maaf dan yang tersisa hanyalah kenangan (dengan asumsi panggilan
asli tidak direkam).
Sedangkan untuk komunikasi elektronik, Anda dapat menghapus postingan Anda. Namun, dalam
waktu antara pembuatan dan penghapusan, beberapa orang lain mungkin telah melihat postingan
asli Anda (atau versi cache) dan menyalinnya ke blog atau situs web lain yang tidak Anda kontrol.
Mesin pencari mungkin telah menemukan yang asli, versi yang di-cache, atau salinan. Dan orang
lain mungkin telah mengambil kata-kata Anda dan mengedarkannya dalam email. Jadi, dengan surat
kertas, kita biasanya dapat menghapus sesuatu yang ingin kita tarik kembali, dan dengan panggilan
telepon, kita dapat meminta maaf dan menebus kesalahan. Tapi begitu sesuatu elektronik di luar
kendali Anda di web, itu mungkin tidak akan pernah dihapus; memang, itu bisa berkembang biak
dan dengan cepat menjadi masalah serius. (Pikirkan, misalnya, video YouTube yang diinginkan
politisi tidak pernah diposting, terutama setelah videonya menjadi viral.)
Situasi serupa menyangkut sesuatu yang ditulis tentang Anda. Orang lain telah memposting sesuatu
di web yang bersifat pribadi tentang Anda, dan Anda ingin menghapusnya. Bahkan jika pembuatnya
setuju, Anda mungkin tidak dapat menghapus semua jejaknya. Keinginan untuk menghapus informasi
lama yang mungkin memalukan ini menjadi fokus upaya Uni Eropa untuk menegakkan “hak untuk
dilupakan”. Selain itu, beberapa orang menemukan bahwa mereka mengungkapkan lebih dari
yang seharusnya di situs-situs seperti Facebook dan Instagram. Calon karyawan ditolak untuk
pekerjaan sebab hal-hal yang mereka tulis yang tersedia secara online. Dan paparan data ini dapat
memengaruhi sebagian besar aspek kehidupan Anda. Misalnya, anggaplah sebuah perusahaan
menyimpan data tentang Anda, dan catatan perusahaan itu terekspos dalam serangan komputer.
Perusahaan mungkin tidak bertanggung jawab untuk mencegah bahaya pada Anda, memberikan
kompensasi kepada Anda jika Anda dirugikan, atau bahkan memberi tahu Anda tentang kejadian
ini .
Hukum Amerika Serikat didasarkan pada prinsip kebebasan bicara yang dilindungi: Di bawah
amandemen pertama Konstitusi A.S., setiap orang dijamin bahwa Kongres tidak dapat mengesahkan
undang-undang “yang meringkas kebebasan berbicara.” Klausul terpisah dari amandemen melindungi
328
hak individu untuk mengekspresikan pendapat secara bebas dalam publikasi, yang telah mengarah
pada praktik mengizinkan jurnalis untuk menjaga anonimitas orang-orang yang pendapatnya
dilaporkan dalam artikel. Kebebasan berbicara dan kebebasan pers menimbulkan pertanyaan
tentang penerapannya pada media digital, seperti yang dijelaskan dalam Kasus 5-2.
Web yaitu arsip sejarah yang hebat, namun sebab arsip, cache, dan situs cermin, hal-hal yang
diposting di web mungkin tidak akan pernah hilang. Seperti yang dilaporkan NBC News, “Sebagian
dari Anda ada di seluruh Internet. Jika Anda telah masuk ke Google dan mencari, menyimpan file di
folder Dropbox Anda, melakukan panggilan telepon memakai Skype, atau baru bangun di pagi
hari dan memeriksa email Anda, Anda meninggalkan jejak remah-remah digital. Orang yang memiliki
akses ke access informasi ini—perusahaan yang mendukung email dan pencarian Web Anda,
pengiklan yang secara strategis mengarahkan iklan kepada Anda—dapat membangun Gambaran
tentang siapa Anda, apa yang Anda sukai, dan apa yang mungkin akan Anda lakukan selanjutnya
… Agen federal dan operator lain dapat memakai data ini , juga.”
Studi Kasus 5-2 : Apakah Tweet Terlindungi dari Kebebasan Berbicara?
Pada bulan Februari 2011, reporter Dana Hedgpeth menulis di Washington Post
bahwa pemerintah AS berusaha untuk mendapatkan informasi pribadi dari akun
Twitter tiga orang yang terkait dengan penyelidikan WikiLeaks. Pengacara pemerintah
meminta nama layar, alamat surat, nomor telepon, rekening bank dan informasi kartu
kredit, dan alamat IP. Namun, pengacara terdakwa bersikeras bahwa informasi ini
dilindungi oleh Amandemen Pertama konstitusi AS.
Meski kasus di pengadilan membahas dokumen WikiLeaks, permintaan pemerintah
ini menimbulkan pertanyaan penting: Data apa yang bisa disita pemerintah dari
jejaring sosial? Kita telah melihat dalam bab ini bahwa pemakai memiliki pilihan
dalam aplikasi tentang melindungi privasi data mereka di jejaring sosial. Tapi bisakah
pemerintah mengesampingkan pengaturan itu? Salah satu pengacara terdakwa
mencatat bahwa "data pemakai akan memberi pemerintah peta orang-orang yang
terkait dengan WikiLeaks dan pada dasarnya menghentikan kebebasan berbicara
secara online." Pengacara pemerintah menunjukkan bahwa ini yaitu permintaan
standar, dan mereka tidak tahu apakah Twitter bahkan mengumpulkan semua item
data yang diminta.
Salah satu masalah yang diangkat dalam permintaan ini yaitu apakah undang-
undang saat ini berlaku untuk teknologi Internet. “Para ahli mengatakan mereka
dimaksudkan untuk menangani catatan telepon, bukan teknologi yang berkembang
seperti email dan tweet.” Seorang pelobi untuk American Civil Liberties Union
mencatat, "Kami memakai alat untuk mengakses informasi di email, situs
jejaring sosial yang tidak pernah terpikirkan." Dalam blog 28 Januari 2011, perwakilan
Twitter menjelaskan posisi perusahaan: "kebebasan berekspresi disertai dengan
mandat untuk melindungi hak pemakai kami untuk berbicara secara bebas dan
mempertahankan kemampuan mereka untuk bersaing dengan mengungkapkan
informasi pribadi mereka."
329
Di beberapa negara, seperti di Uni Eropa, Anda memiliki data Anda dan harus memberikan izin
sebelum dapat dipakai dalam berbagai cara. Namun di negara lain, seperti Amerika Serikat,
pemegang data yaitu pemiliknya—salah satu alasan mengapa membiarkan salinan lolos ke
seseorang atau di tempat lain yaitu masalah. namun bahkan jika undang-undang berubah untuk
memungkinkan kita masing-masing memiliki data kita, lalu bagaimana? Berapa banyak dari kita
yang ingin menghabiskan sebagian besar hari kita dengan memberikan izin kepada kamera lalu
lintas, situs web, dan penyedia email untuk memakai data kita?
Masalah ini—pengumpulan data, pemberitahuan dan persetujuan, serta kontrol dan kepemilikan
data—memiliki implikasi privasi yang signifikan. Salah satu cara kami mengatasi masalah semacam
ini yaitu dengan kebijakan: pernyataan praktik tertulis yang menginformasikan semua pihak yang
terkena dampak tentang hak dan tanggung jawab mereka. Di bagian berikutnya kami menyelidiki
kebijakan privasi untuk komputasi.
5.2 Prinsip dan Kebijakan Privasi
Dengan aplikasi internet yang begitu masif dalam mengumpulkan informasi, kunci dari konsep
privasi yaitu kontrol pemakai /warga terhadap informasi pribadinya, penghormatan batas privasi
dan perlindungan terhadap informasi ini . Ibaratnya seorang teman baik yang dipercaya untuk
menyimpan rahasia dan menjamin rahasia yang disimpan tidak akan disebarkan. Para penyedia
layanan, baik pihak swasta maupun pemerintah, harus melindungi informasi yang kita berikan,
bagaimanapun caranya.
Di Amerika Serikat, ketertarikan pada privasi elektronik dan database komputer setidaknya dimulai
pada awal 1970-an. Perhatian publik terhadap privasi telah bervariasi selama bertahun-tahun. Pada
awal 1970-an, komite yang disponsori pemerintah federal mengembangkan seperangkat prinsip
privasi, yang disebut Praktik Informasi yang Adil, yang tidak hanya memengaruhi undang-undang
dan peraturan AS, namun juga meletakkan dasar bagi undang-undang privasi di negara lain.
5.2.1 Praktik Informasi yang Adil
Pada tahun 1973 Willis Ware dari RAND Corporation mengetuai sebuah komite untuk menasihati
Sekretaris Departemen Kesehatan, Pendidikan, dan Kesejahteraan AS (sekarang disebut Layanan
Kesehatan dan Kemanusiaan) tentang masalah privasi. Laporan (mengusulkan seperangkat prinsip
berdasarkan praktik informasi yang adil:
• Batasan koleksi. Data harus diperoleh secara sah dan adil.
• Kualitas data. Data harus relevan dengan tujuannya, akurat, lengkap, dan terkini.
• Spesifikasi tujuan. Tujuan pemakai an data harus diidentifikasi dan data dimusnahkan jika tidak
lagi diperlukan untuk tujuan ini .
• Penerapan batasan. pemakai an untuk tujuan selain yang ditentukan hanya diizinkan dengan
persetujuan subjek data atau oleh otoritas hukum.
• Perlindungan keamanan. Prosedur untuk menjaga dari kehilangan, korupsi, perusakan, atau
penyalahgunaan data harus ditetapkan.
330
• Keterbukaan. Harus dimungkinkan untuk memperoleh informasi tentang pengumpulan,
penyimpanan, dan pemakai an sistem data pribadi.
• Partisipasi individu. Subyek data biasanya memiliki hak untuk mengakses dan menantang data
yang berkaitan dengan mereka.
• Akuntabilitas. Pengontrol data harus ditunjuk dan bertanggung jawab untuk mematuhi langkah-
langkah untuk mempengaruhi prinsip-prinsip.
Prinsip-prinsip ini menggambarkan hak individu, bukan persyaratan kolektor; yaitu, prinsip-prinsip
ini tidak memerlukan perlindungan terhadap data yang dikumpulkan.
Ware menyatakan ada beberapa masalah penting, termasuk penautan data dalam banyak file dan
pemakai an kunci yang berlebihan, seperti nomor jaminan sosial, yang tidak pernah dimaksudkan
untuk dipakai sebagai pengidentifikasi catatan. Dan meskipun dia melihat bahwa masyarakat dapat
bergerak ke arah pemakai an nomor identitas universal, dia takut bahwa gerakan itu akan terjadi
tanpa rencana (dan sebab nya tanpa kendali). Dia benar, meskipun dia tidak dapat memperkirakan
jumlah pertukaran data selama 40 tahun lalu .
Menurut Rein Turn dan Willis Ware melindungi item data itu sendiri, mengakui bahwa kumpulan
data akan menjadi target yang menarik untuk serangan akses yang tidak sah. Mereka menyarankan
empat cara untuk melindungi data yang disimpan:
• Kurangi keterpaparan dengan membatasi jumlah data yang dipelihara, hanya menanyakan apa
yang diperlukan dan memakai sampel acak alih-alih populasi lengkap.
• Kurangi sensitivitas data dengan menukar item data atau menambahkan kesalahan halus pada
data (dan memperingatkan penerima bahwa data telah diubah).
• Anonimkan data dengan menghapus atau memodifikasi item data pengidentifikasi.
• Enkripsi data.
Hukum Privasi AS Privacy
Ware dan komitenya mengharapkan prinsip-prinsip ini berlaku untuk semua kumpulan data pribadi
tentang individu, namun kenyataannya jauh dari tujuan ini. Sebaliknya, laporan komite Ware mengarah
pada Undang-Undang Privasi 1974 (5 USC 552a), yang mewujudkan sebagian besar prinsip-
prinsip ini, meskipun undang-undang itu hanya berlaku untuk data yang dikumpulkan dan dikelola
oleh pemerintah AS. Namun demikian, Undang-Undang Privasi yaitu undang-undang yang luas,
mencakup semua data yang dikumpulkan oleh pemerintah. Ini yaitu undang-undang privasi AS
yang terkuat sebab luasnya: Ini berlaku untuk semua data pribadi yang disimpan di mana saja di
pemerintah federal.
Amerika Serikat lalu mengesahkan undang-undang yang melindungi data yang dikumpulkan
dan disimpan oleh organisasi lain, namun undang-undang ini berlaku sedikit demi sedikit, menurut
tipe data individu. Misalnya, kredit konsumen dibahas dalam Fair Credit Reporting Act, informasi
kesehatan dalam Health Insurance Portability and Accountability Act (HIPAA), organisasi jasa
keuangan dalam Gramm–Leach–Bliley Act (GLBA), akses web anak-anak di Children's Online
Privacy Protection Act (COPPA), dan catatan siswa di Federal Educational Rights and Privacy Act.
Tidak mengherankan, undang-undang terpisah ini tidak konsisten dalam melindungi privasi.
331
Amerika Serikat juga mengizinkan pemerintah negara bagian untuk mengatur aspek privasi tertentu.
Misalnya, Smith secara teratur menerbitkan kompilasi undang-undang privasi negara bagian dan
federal; bagian utama mengGambarkan Amerika Serikat, dan lampiran membahas undang-undang
privasi di Kanada dan provinsinya. Undang-undang negara bagian dapat sangat bervariasi, terkadang
menyulitkan seseorang untuk mematuhi undang-undang privasi di setiap negara bagian. Misalnya, di
Nevada, perekam kotak hitam tidak boleh dipasang di mobil tanpa persetujuan pemilik atau penyewa
mobil. (Status Rev. Nevada bagian 484 638). Demikian pula, di New Hampshire, pabrikan harus
mengungkapkan kepada pemilik keberadaan perekam data kejadian di mobil baru (New Hampshire
Rev. Statute ann. Sec. 357-G:1). Namun, baik di negara bagian New York dan North Dakota, ada
batasan lebih lanjut pada jenis data yang dapat ditangkap oleh perekam; misalnya, di North Dakota,
data hanya dapat dipakai untuk memperbaiki mobil atau untuk meningkatkan keselamatan. (Kode
Cent. Dakota Utara det. 51-04.28).
Perlindungan Data Pribadi di Indonesia
Indonesia akhirnya memiliki aturan soal perlindungan data pribadi di era digital.Aturan itu dituangkan
dalam bentuk Peraturan Menteri (Permen) No 20 Tahun 2016 tentang Perlindungan Data Pribadi
(PDP) ditetapkan 7 November 2016, diundangkan dan berlaku sejak 1 Desember 2016. Dari
dokumen yang diunduh, di aturan itu dinyatakan Data Pribadi yaitu data perseorangan tertentu
yang disimpan, dirawat, dan dijaga kebenaran serta dilindungi kerahasiaannya.
Pemilik Data Pribadi yaitu individu yang padanya melekat Data Perseorangan Tertentu.Setiap
Penyelenggara Sistem Elektronik harus mempunyai aturan internal perlindungan Data Pribadi untuk
melaksanakan proses.Setiap Penyelenggara Sistem Elektronik harus menyusun aturan internal
perlindungan Data Pribadi sebagai bentuk tindakan pencegahan untuk menghindari terjadinya
kegagalan dalam perlindungan Data Pribadi yang dikelolanya. Perolehan dan pengumpulan Data
Pribadi oleh Penyelenggara Sistem Elektronik wajib berdasarkan Persetujuan atau berdasarkan
ketentuan peraturan perundang-undangan.
Data Pribadi yang disimpan dalam Sistem Elektronik harus Data Pribadi yang telah diverifikasi
keakuratannya. Data Pribadi yang disimpan dalam Sistem Elektronik harus dalam bentuk data
terenkripsi.Data Pribadi wajib disimpan dalam Sistem Elektronik sesuai dengan ketentuan peraturan
perundang-undangan yang mengatur kewajiban jangka waktu penyimpanan Data Pribadi pada
masing-masing Instansi Pengawas dan Pengatur Sektor atau paling singkat lima tahun, jika belum
terdapat ketentuan peraturan perundang-undangan yang secara khusus mengatur untuk itu.Aturan
data center. Hal yang menarik di aturan ini yaitu ketentuan Pusat data(data center) dan pusat
pemulihan bencana (disaster recovery center) Penyelenggara Sistem Elektronik untuk pelayanan
publik yang dipakai untuk proses perlindungan wajib ditempatkan dalam wilayah negara
Republik Indonesia.
Dalam aturan ini ditegaskan sistem elektronik yang dapat dipakai dalam proses perlindungan
data pribadi yaitu sistem elektronik yang sudah tersertifikasi dan mempunyai aturan internal tentang
perlindungan data pribadi yang wajib memperhatikan aspek penerapan teknologi, sumber daya
manusia, metode, dan biayanya. Pemilik data pribadi, berhak atas kerahasiaan data miliknya; berhak
mengajukan pengaduan dalam rangka penyelesaian sengket data pribadi; berhak mendapatkan akses
untuk memperoleh historis data pribadinya; dan berhak meminta pemusnahan data perseorangan
tertentu miliknya dalam sistem elektronik.
332
Penyelenggara system Elektronik wajib memberikan akses atau kesempatan kepada Pemilik
Data Pribadi untuk mengubah atau memperbarui Data Pribadinya tanpa mengganggu sistem
pengelolaan Data Pribadi, kecuali ditentukan lain oleh ketentuan peraturan perundang-undangan;
memusnahkan Data Pribadi sesuai dengan ketentuan dalam Peraturan Menteri ini atau ketentuan
peraturan perundang-undangan lainnya yang secara khusus mengatur di masing-masing Instansi
Pengawas dan Pengatur Sektor untuk itu; dan menyediakan narahubung (contact person) yang
mudah dihubungi oleh Pemilik Data Pribadi terkait pengelolaan Data Pribadinya.
Apabila pemilik data pribadi merupakan kategori anak-anak, pemberian persetujuan sebagaimana
yang di maksud dalam permen ini dilakukan oleh orang tua atau wali anak yang bersangkutan.
Untuk penyelenggara sistem elektronik yang telah menyediakan, menyimpan, dan mengelola data
pribadi sebelum Permen ini berlaku, wajib tetap menjaga kerahasiaan data pribadi yang telah ada.
Bagi yang melanggar aturan hanya dikenai sangsi administratif berupa:
(a) P




