ความคิดเห็นที่ 3
================================================
จขกท, หลักการพวกนี้คือเอาข้อความที่เหมือนกันมาทำค่าแทนไว้ครับ แล้วจะเก็บดัชนีไว้ ตัวอย่างเช่นผมพิมพ์ aa bb cc aaaa bbbb cccc ยาว 23 ตัว ผมเปลี่ยนเป็น 1 2 3 11 22 33 เหลือ 14 ตัวครับ แล้วก็เก็บ 1 == aa 2 == bb 3 == cc ครับ เทคนิคนี้ บางคนหัวหมอ เขียน aaaaaaaaaaaaaaaa ยาวไปเรื่อยๆ แล้วเวลาเก็บมันอาจจะใช้วิธีการนับอักษรครับ ไฟล์เลยออกมาติ๊ดนึง แต่พอแตกออกมาอาจจะเป็น GB/TB ก็ยังได้เลย แล้วให้พวกหัวหมอเนี่ยครับ มันจะแนบเป็นอีเมลไป ซึ่งไม่ได้จะไปแกล้งคนรับครับ แต่แกล้งตัว server เอง เพราะ server บางตัวมันฉลาดครับ สามารถสแกนไวรัสในไฟล์บีบอัดได้ แต่ก็ต้องแตกออกมา พอแตกออกมาเท่านั้นแหละครับ แรมเต็ม ;)
สำหรับที่ .zip แกะรหัสง่ายนั้น เกิดจากการจัดเก็บรหัสด้วยวิธีง่ายเกินไป สามารถหาค่าเดิมได้ง่าย แต่กับ rar นั้นยังหาค่าเดิมไม่ได้ครับ(ถ้าคิดว่าเป็นไปไม่ได้, ในเว็บไซต์ต่างๆ จะใช้ระบบ MD5 เก็บรหัสครับ(จริงๆ MD5 ก็มีข้อเสีย ใช้ SHA1 ดีกว่า) แบบนี้ ไม่ว่าจะใส่ไฟล์ 4gb เข้าไปหรือไม่ใส่เข้าไปซักตัว ค่าออกมาความยาวเท่ากันเป๊ะครับ ดังนั้นจึงถอดไม่ได้ อย่างไรก็ตาม MD5 มีข้อเสียคือมีผู้ค้นพบ collision ครับคือเข้ารหัสสองไฟล์แล้วได้ผลลัพท์ออกมาเหมือนกันเป๊ะ แต่ SHA1 ปัจจุบันยังไม่มี และกำลังมีผู้พยายามค้นหาด้วยครับ(โครงการ SHA1 Collision Search Graz ถ้าสนใจอยากเข้าร่วมโดยบริจาค cpu ว่างๆ เชิญที่เว็บ http://boinc.iaik.tugraz.at/sha1_coll_search/ ครับ))
ส่วนเรื่องของ 7z บีบได้ดีกว่า อันนี้ก็ขึ้นอยู่กับวิธีการเก็บด้วยครับว่าเก็บกันอย่างไรให้มันเล็ก(Algorithm) แต่เล็กมากๆ เช่น UHARC, KGB มันก็จะใช้เวลาบีบมากๆครับ เคยเจอ Office 2007 beta ใส่ kgb มา 200mb กว่าๆ จับลงแผ่นดิสก์ได้พอดีเลยครับ(1.44mb เป๊ะๆ จะว่าลงแผ่นดิสก์จริงๆก็ไม่ได้หรอกครับ ต้องใช้การฟอร์แมตพิเศษที่ทำให้มีที่ 2mb) แต่ผมแตกรอชั่วโมงนึงแล้วมันก็ยังไม่ออกมาซักไฟล์ครับ o_O
http://www.zone-it.com/f/action:printpage/topic:34835.0
หัวข้อ: Re: หลักการในการบีบอัดข้อมูล Zip Rar ... เริ่มหัวข้อโดย: ออ (all) ที่ 31 มีนาคม พ.ศ. 2551, 20:35:57
================================================
หวังว่าคงพอช่วงไขความกระจ่างได้บ้างนะครับ ^ ^
จากคุณ :
76 (KuMp)
- [
วันวิทยาศาสตร์แห่งชาติ 07:53:41
]
|
|
|