Wednesday, September 26, 2012

php การปรับแต่งตารางฐานข้อมูล mysql เพื่อให้การ query ข้อมูลเร็วขึ้น

php การปรับแต่งตารางฐานข้อมูล mysql เพื่อให้การ query ข้อมูลเร็วขึ้น เวลาที่มีการ delete ข้อมูลเกิดขึ้น ก็จะเกิดมีขยะส่วนเกินเกิดขึ้นในตาราง ยิ่งจำนวนเร็คคอร์ดในตารางมีมาก และมีการลบ อัพเดต ข้อมูลอยู่บ่อยๆ ก็จะทำให้เกิด ขยะส่วนเกินมากขึ้นตาม ซึ่งเราก็จะเสียพื้นที่ส่วนนั้นไป และทำให้การ query ข้อมูลช้าลง 

overhead พื้นที่ส่วนเกินในตาราง

ผมเจอปัญหา overhead และก็พยายามหาวิธีมานาน โชคดีไปเจอกระทู้ถามตอบเกี่ยวกับ overhead เข้า และคิดว่าอาจจะมีประโยชน์ต่อใครอีกหลายๆคน สามารถอ่านทำความเข้าใจ overhead ตามอ้างอิงด้านล่างนี้


overhead จะเกิดขึ้นเวลาเราลบ record ครับ เพราะ DBMS มันไม่ลบข้อมูลออกจริง ๆ แค่ไปมาร์คที่ record ว่าลบแล้ว ทั้งนี้ก็เพื่อลด I/O ที่จะเกิดขึ้น และเวลามี insert มันก็มา reuse พื้นที่ตรงนี้แหล่ะครับ

OPTIMIZE ก็คือไปจัดการตรงนี้ให้มันลบจริง ๆ จะได้ประหยัดพื้นที่

ส่วนคำถามที่สองผมไม่รู้ครับ ต้องรอท่านอื่นมาตอบ


weahason, on Mar 4 2008, 02:16 PM, said:
ทั้งนี้ก็เพื่อลด I/O ที่จะเกิดขึ้น

ผมก็ยังไม่เข้าใจอยู่หน่อยๆครับ
ขอขยายความตรงนี้หน่อยครับ

ว่าถ้า DBMS นี้ลบทันที กับ การ mark แบบนี้
ข้อดีข้อเสียต่างกันอย่างไร

คือผมใช้ MySql ถามว่า DBMS ตัวอื่นๆเป็นเหมือนกันหรือเป่าครับ


เป็นทุก DBMS แหล่ะครับ ลองดูตัวอย่างดีกว่า

มี text file อยู่ไฟล์นึง มีข้อกำหนดว่า แต่ละบรรทัดมีจำนวนไบต์เท่ากัน คือ 40 ไบต์ ถ้าไม่ใช้ก็ใส่ช่องว่างเข้าไป (เพื่อจะได้ seek ง่าย ๆ)

001 | this is a DBMS record
002 | this is another DBMS record
003 | this one will be deleted soon
004 | this one won't be deleted
005 | another record

เราจะลบ record 003 เราจะทำอย่างไรครับ
001 | this is a DBMS record
002 | this is another DBMS record
004 | this one won't be deleted
005 | another record


- ลบบรรทัดนั้นทิ้งไป ย้ายบรรทัดล่าง ๆ ขึ้นมา
เหมือนจะง่าย แต่ถ้าเรามีสัก 1 ล้าน record แล้วเรากำลังลบ record ที่ 3 แปลว่าเราอ่านและเขียนข้อมูล 1,000,000-3 = 999,997 บรรทัด หรือ 39,999,880 ไบต์ รวม 79,999,760 ไบต์เพราะต้องอ่านและเขียน วิธีนี้ไม่สวยแน่ ๆ

001 | this is a DBMS record
002 | this is another DBMS record

004 | this one won't be deleted
005 | another record


- เปลี่ยนเนื้อหาบรรทัด 3 เป็นช่องว่างให้หมด
เราต้องเขียนค่า 0 ลงในบรรทัด 3 ทั้งหมด 40 ไบต์ ดีขึ้นเยอะ


001 | this is a DBMS record
002 | this is another DBMS record
005 | another record
004 | this one won't be deleted


- ย้ายบรรทัดสุดท้ายมาแทนบรรทัดที่ 3
เราต้องอ่านบรรทัดสุดท้าย 40 ไบต์ เขียนทับบรรทัด 3 อีก 40 ไบต์ และลบบรรทัดสุดท้ายทิ้งโดยการลดขนาดไฟล์อีก 4 ไบต์ รวม 83 ไบต์ และเสียความสามารถในการเรียงลำดับไป

และวิธีสุดท้าย
เปลี่ยน ID ของบรรทัด 3 ให้เป็นค่าที่เป็นไปไม่ได้ เพื่อเขียนคราวหลังจะได้มาทับตรงนี้

001 | this is a DBMS record
002 | this is another DBMS record
?03 | this one will be deleted soon
004 | this one won't be deleted
005 | another record


ไบต์เดียวเอง

ลด I/O มหาศาล
This post has been edited by iWat: 04 March 2008 - 02:54 PM

อ้างอิง : http://www.narisa.com/forums/index.php?showtopic=22474



ส่วนการแก้ไข ปรับแต่งตาราง เราสามารถทำได้ผ่าน phpmyadmin หากมีข้อมูลขยะเกิดขึ้นในตารางนั้น ก็จะมีคำสั่ง Optimize table ขึ้นให้เราคลิก 

แต่หากไม่อยากเข้าไปแก้ใน phpmyadmin ทุกวัน ทุกอาทิตย์ ทุกเดือน เราก็ใช้ php ตรวจสอบและปรับแต่งอัตโนมัติ ตามที่เราต้องการ โค็ดสั้นๆ ไม่ยากอะไร ตามด้านล่างนี้

Code (PHP)
01.<?php
02.$con = @mysql_connect("localhost","root","1234");
03.$selectDB = mysql_select_db("db");
04.mysql_query("SET NAMES 'UTF8'");
05. 
06.$query = mysql_query("SHOW TABLE STATUS LIKE 'table'");  // ดึงสถานะตาราง
07. 
08.$row = mysql_fetch_assoc($query);
09. 
10.if($row['Data_free']>2000)  // เช็คค่า overhead ถ้าเกินที่กำหนด
11.{
12.$optimize = mysql_query("OPTIMIZE TABLE `table` "); // ปรับตาราง
13.}
14.?>

No comments:

Post a Comment