นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
เครือข่าย
สมาชิก · ติดตาม: 0 · ผู้ติดตาม: 16

อ่าน: 1255
ความเห็น: 0

ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: แกะกล่อง ๖ [C]

ถั่วที่ไม่ใช่่ถั่วแดง ไม่ใช่ถั่วดำ ไม่ใช่ถั่วฝักยาว ไม่ใช่ถั่วแระ ไม่ใช่ถั่วเขียว ไม่ใช่ถั่วเหลือง

มาขัดบันทึกในซีรีย์ไปวัดด้วยบันทึกนี้ก่อนนะครับ เนื่องจากบันทึกในซีรีย์ไปวัดนั้นออกมาขัดกับบันทึกในซีรี่ย์นี้

ซีรีย์ที่ว่านี้คือซีรีย์แกะกล่องครับ

บันทึกในซีรีย์แกะกล่อง

ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: แกะกล่อง ๕
ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: แกะกล่อง ๔
ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: แกะกล่อง ๓
ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: แกะกล่อง ๒
ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป: แกะกล่อง

 


 

จากบันทึกแกะกล่องบันทึกหลังสุด ที่นำเสนอรูปของ beanplot เอาไว้ แล้วก็ยุติเนื้อหาเอาไว้เท่านั้น หลายคนก็อาจจะยังง ๆ ว่าแล้วเจ้า beanplot ที่ว่านั้นมันให้ข้อมูลอะไรกับเราที่น่าสนใจบ้าง หรือให้ข้อมูลอะไรที่ดีกว่า boxplot ธรรมดา ๆ บ้าง

 

จาก beanplot ข้อมูลด้านล่าง

> b1 <- rnorm(250,10,2)
> b2 <- rnorm(250,5,1.5)
> bimodal2 <- c(b1,b2)
> library(beanplot)
> beanplot(bimodal2,col="magenta")

 

beanplot ข้างต้นบอกข้อมูลอะไรเราบ้าง

beanplot ประกอบไปด้วย plot ๒ plot นั่นคือ density plot และ 1D-scatter plot

  • density plot คือส่วนที่เป็นพื้นที่สี magenta
  • 1-D scatter plot คือส่วนที่เป็นแถบดำ ๆ ที่คล้าย ๆ กับ barcode

 

> plot(density(bimodal2))
> polygon(density(bimodal2), col="magenta")

densiy plot ของข้อมูล bimodal2

จาก density plot เราจะเห็น density plot มีรูปร่างคล้าย ๆ กับภูเขาที่มี ๒ ยอด ยอดหนึ่งสูงอีกยอดหนึ่งเตี้ยกว่า ซึ่งข้อมูลนี้หากเรา plot ด้วย boxplot จะได้เป็น

> boxplot(bimodal2)

จาก boxplot เราจะพบว่าข้อมูล bimodal2 นั้นมีการกระจายที่ไม่เป็นแบบ normal distribution แต่แท้จริงแล้วข้อมูล bimodal2 นี้เกิดจากการที่ผมนำเอาข้อมูลที่มีการกระจายแบบ normal distribution 2 ข้อมูลมารวมกัน

boxplot จะไม่สามารถแยกข้อมูลทั้งสองออกจากกันได้ เมื่อมาสร้างเป็น boxplot ก็จะพบว่าขอมูลของเรามีการกระจายที่ไม่เป็นแบบ normal distribution ทั้ง ๆ ที่ข้อมูล bimodal2 นี้แท้จริงแล้วเป็นข้อมูลที่เป็น normal distribution 2 ข้อมูล หรือมีข้อมูลอยู่ ๒ ชุด

แต่เมื่อมา plot ด้วย density plot เราจะพบว่า density plot จะแสดงจุด peak ของข้อมูลหรือยอดของข้อมูลนี้เป็น ๒ ยอดซึ่งทำให้เรามองเห็นข้อเท็จจริงของข้อมูลมากขึ้น ที่เราพบว่าเมื่อทำ boxplot แล้วข้อมูลไม่ normal distribution นั้นเกิดจากอะไร ใน boxplot ไม่มี outlier แสดงว่าส่วนสำคัญที่ทำให้ข้อมูลไม่มีการกระจายแบบ normal distribution นั้นไม่ได้เกิดจากอิทธิพลของ outlier แต่อย่างใด อาจจะเป็นตัวข้อมูลเองที่ไม่มีการกระจายแบบ normal distribution หรือเกิดจากสาเหตุอื่น

 

ถ้าเราเอาข้อมูลต้นฉบับคือ b1 ละ b2 มาสร้าง boxplot หรือ desity plot จะได้เป็น

> par(mfrow=c(2,2))
> boxplot(b1)
> boxplot(b2)
> plot(density(b1))
> polygon(density(b1), col="blue")
> plot(density(b2))
> polygon(density(b2), col="green")

 

จาก boxplot ข้างต้นจะพบว่าข้อมูล b1 และ b2 มีการกระจายที่เป็นแบบ normal distribution ทั้งคู่ (boxplot แต่ละรูปมีลักษณะสมมาตร) และ density plot แต่ละข้อมูล (b1, b2) เป็นภูเขาที่มียอดเดียว และรูปร่างใกล้เคียงกับ normal distribution หรือใกล้เคียงกับรูประฆังคว่ำ

 

คราวนี้มาดูรูปนี้ครับ

> par(mfrow=c(2,2))
> plot(density(b1), col="blue", ylim=c(0,0.3), xlim=c(-0.2,20))
> lines(density(b2), col="green")
> plot(density(b1), col="blue", ylim=c(0,0.3), xlim=c(-0.2,20))
> polygon(density(b1), col="blue")
> lines(density(b2), col="green")
> polygon(density(b2), col="green")
> beanplot(bimodal2,col="turquoise")
> b1x <- density(b1)
> b2x <- density(b2)
> limb12 <- range(b1x$x,b2x$x)
> b1x <- density(b1, from=limb12[1], to=limb12[2])
> b2x <- density(b2, from=limb12[1], to=limb12[2])
> plot(density(b1), col="blue", ylim=c(0,0.3), xlim=c(-0.2,20))
> lines(density(b2), col="green")
> polygon(b1x$x, pmin(b1x$y, b2x$y), col="turquoise")

รูปข้างต้นมีทั้งหมด ๔ รูปย่อย รูปย่อยแรกเป็นการ density plot ของข้อมูล b1 และ b2 จะเห็นว่า density plot ของ b1 และ b2 มีบางส่วนซ้อนทับกันอยู่ (เส้นสีเขียวกับเส้นสีน้ำเงิน)

รูปย่อย ๒ เมื่อเติมสีให้กับ density plot แต่ละข้อมูล พื้นที่สีน้ำเงินจะแทนข้อมูล b1 พื้นที่ีเขียวจะแทนการกระจายของข้อมูล b2

รูปย่อย ๓ เป็น beanplot ของข้อมูล bimodal2 ซึ่งเป็นการรวมกันของข้อมูล b1 และ b2

รูปย่อย ๔ แสดงพื้นที่ที่ทับซ้อนกันอยู่ของข้อมูล b1 และ b2 เมื่อเรา plot density plot ของข้อมูลทั้งสองให้ด้วยกัน จะพบว่า density plot ที่ซ้อนทับกันมีลักษณะเป็นเหมือนภูเขาที่มี ๒ ยอด

 

พื้นที่ที่เป็นสี turquoise ใน bean plot นั้นก็คือ density plot ของข้อมูล bimodal2 ที่อยู่ในแนวตั้งนั่นเอง

ถ้าเราหมุน beanplot ให้อยู่ในแนวนอน จะได้เป็น

> par(mfcol=c(2,1))
> beanplot(bimodal2,col="turquoise", horizontal=T, main="bean plot of bimodal2")
> plot(density(bimodal2))
> polygon(density(bimodal2), col="turquoise")

 

เพื่อความสวยงามหรือเพื่อให้เป็น bean จริง ๆ ใน bean plot จะใส่ density plot ทั้งส่วนที่เป็น density plot และส่วนที่เป็น mirror side ของ density plot หรือส่วนที่เปรียบเสมือนเงาในกระจก (เงาในน้ำของภูเขา)

> plot(density(bimodal2),xlab="", main="", ylim=c(-0.15,0.15))
> polygon(density(bimodal2), col="turquoise")
> bi2 <- density(bimodal2)
> bi2$y <- -(bi2$y)
> lines(bi2, xlab="", main="")
> polygon(bi2, col="turquoise")

 

แต่เมื่อเปรียบเทียบกับที่เราทำ density plot ทีละข้อมูล (b1, b2) นั้นเราจะเห็นชัดเจนว่าข้อมูลแบ่งเป็น ๒ ชุด หรือยอดของภูเขาแยกกันชัดเจนดังภาพ

> plot(density(b1), col="blue", ylim=c(0,0.3), xlim=c(-0.2,18))
> lines(density(b2), col="green")
> polygon(b1x$x, pmin(b1x$y, b2x$y), col="turquoise")

แต่เมื่อทำเป็น beanplot แล้ว เราจะเห็นยอดของภูเขาทั้ง ๒ แยกกันไม่ชัดเท่าไหร่นั้น เนื่องจากเมื่อมีข้อมูลที่มีค่าเหมือนกันจะทำให้ความถี่ของข้อมูลส่วนที่มีค่าเหมือนกันทั้ง ๒ ข้อมูล มีค่าเพิ่มขึ้นอีกเท่าตัว (จุดทับซ้อนที่เป็นสี turquoise ของภาพข้างต้น) เลยทำให้แยกยอดของข้อมูลทั้ง๒ ได้ไม่ชัดเจน

ในตัวอย่างนี้หากข้อมูลมีลักษณะเป็น bimodal หรือข้อมูล ๒ กลุ่ม (ที่มีส่วนหนึ่งของข้อมูลมีค่าทับซ้อนกันอยู่) bean plot จะสามารถบ่งบอกถึงลักษณะของข้อมูลได้ดีกว่า box plot ธรรมดา

 

การเรียบเรียงในบันทึกนี้อาจจะทำให้ท่านผู้อ่านที่รักงง ๆ ไปมากนะครับ เพราะผมเองก็อ่านแล้วงงๆ เหมือนกัน มันวนไปวนมายังไงยังงั้น

เอาเป็นว่าอย่างงกับมัน เพราะงั้นฟังเพลงดีกว่า

 

อิอิอิ

 

เราเอง

 

เพลง: หนุ่มฟ้อหล่อเฟี้ยว
ศิลปิน: สังข์ทอง สีใส
คำร้อง/ ทำนอง: สังข์ทอง สีใส

 

หมวดหมู่บันทึก: เรื่องทั่วไป
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 21 กันยายน 2558 17:52 แก้ไข: 15 สิงหาคม 2562 19:04 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 คนธรรมดา, Ico24 บิวตี้, และ Ico24 โอ๋-อโณ.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

ไม่มีความเห็น
คุณต้องทำการเข้าระบบก่อนแสดงความเห็น