Wichanard

View My GitHub Profile

📊 Live Lab: Data Type Selection and Conversion

CompTIA Data+ (DA0-001) Implementation 📝 Project Overview (āļ āļēāļžāļĢāļ§āļĄāđ‚āļ„āļĢāļ‡āļāļēāļĢ) This project focuses on the foundational skills of a Data Analyst: ensuring data consistency and integrity across multiple platforms. In this lab, I performed end-to-end data type management—starting from the SQL source level to the transformation layer in Power Query.

āđ‚āļ›āļĢāđ€āļˆāļāļ•āđŒāļ™āļĩāđ‰āđ€āļ™āđ‰āļ™āļāļēāļĢāļāļķāļāļāļ™āļ—āļąāļāļĐāļ°āļžāļ·āđ‰āļ™āļāļēāļ™āļ—āļĩāđˆāļŠāļģāļ„āļąāļāļ—āļĩāđˆāļŠāļļāļ”āļ‚āļ­āļ‡ Data Analyst āļ„āļ·āļ­āļāļēāļĢāļ—āļģāđƒāļŦāđ‰āļ‚āđ‰āļ­āļĄāļđāļĨāļĄāļĩāļ„āļ§āļēāļĄāļ–āļđāļāļ•āđ‰āļ­āļ‡āđāļĨāļ°āļŠāļ­āļ”āļ„āļĨāđ‰āļ­āļ‡āļāļąāļ™āđƒāļ™āļ—āļļāļāđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ āđ‚āļ”āļĒāļœāļĄāđ„āļ”āđ‰āļ”āļģāđ€āļ™āļīāļ™āļāļēāļĢāļˆāļąāļ”āļāļēāļĢāļ›āļĢāļ°āđ€āļ āļ—āļ‚āđ‰āļ­āļĄāļđāļĨāļ•āļąāđ‰āļ‡āđāļ•āđˆāļĢāļ°āļ”āļąāļšāļ•āđ‰āļ™āļ—āļēāļ‡ (SQL Database) āđ„āļ›āļˆāļ™āļ–āļķāļ‡āļ‚āļąāđ‰āļ™āļ•āļ­āļ™āļāļēāļĢāđāļ›āļĨāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Transformation) āđƒāļ™ Power Query

āđ‚āļ”āļĒāļĄāļĩāļ‚āļąāđ‰āļ™āļ•āļ­āļ™āļ”āļąāļ‡āļ™āļĩāđ‰

āļ āļēāļžāļ—āļĩāđˆ 1: āļāļēāļĢāđ€āļŠāđ‡āļ„āđāļŦāļĨāđˆāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Source Exploration)

āļŠāļīāđˆāļ‡āļ—āļĩāđˆāļāļģāļĨāļąāļ‡āļ—āļģāļ­āļĒāļđāđˆ: āđ€āļĢāļēāļāļģāļĨāļąāļ‡āđƒāļŠāđ‰āļ‡āļēāļ™ Microsoft SQL Server Management Studio (SSMS) āđ€āļžāļ·āđˆāļ­āļŠāļģāļĢāļ§āļˆāļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨ TDHS_StudentInfoSys āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”: āļ„āļĨāļīāļāļ‚āļ§āļēāļ—āļĩāđˆāļ•āļēāļĢāļēāļ‡ dbo.tblEnrollment āđāļĨāļ°āđ€āļ•āļĢāļĩāļĒāļĄāđƒāļŠāđ‰āļ„āļģāļŠāļąāđˆāļ‡ Select Top 1000 Rows āļ™āļĩāđˆāļ„āļ·āļ­āļ‚āļąāđ‰āļ™āļ•āļ­āļ™āđāļĢāļāđƒāļ™āļāļēāļĢāļ—āļģ Data Profiling āđ€āļžāļ·āđˆāļ­āļ‚āļ­āļ”āļđāļŦāļ™āđ‰āļēāļ•āļēāļ‚āđ‰āļ­āļĄāļđāļĨāļ„āļĢāđˆāļēāļ§āđ† āļ§āđˆāļēāļĄāļĩāļĨāļąāļāļĐāļ“āļ°āļ­āļĒāđˆāļēāļ‡āđ„āļĢāļāđˆāļ­āļ™āļ™āļģāđ„āļ›āļ”āļķāļ‡āđ„āļ›āļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāļ•āđˆāļ­

āļ āļēāļžāļ—āļĩāđˆ 2: āļāļēāļĢāļ•āļĢāļ§āļˆāļŠāļ­āļšāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Schema & Data Type Inspection)

āļŠāļīāđˆāļ‡āļ—āļĩāđˆāļāļģāļĨāļąāļ‡āļ—āļģāļ­āļĒāļđāđˆ: āđ€āļ›āļīāļ”āļ”āļđāļŦāļ™āđ‰āļēāļ•āđˆāļēāļ‡ Design āļ‚āļ­āļ‡āļ•āļēāļĢāļēāļ‡ dbo.tblEnrollment āđ€āļžāļ·āđˆāļ­āļ•āļĢāļ§āļˆāļŠāļ­āļš Data Dictionary āļŦāļĢāļ·āļ­ Schema āļ‚āļ­āļ‡āļ•āļēāļĢāļēāļ‡āļ™āļĩāđ‰ āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”: āļĢāļ°āļšāļšāđāļŠāļ”āļ‡āđƒāļŦāđ‰āđ€āļŦāđ‡āļ™āļŠāļ·āđˆāļ­āļ„āļ­āļĨāļąāļĄāļ™āđŒāđāļĨāļ° Data Type āļ•āđ‰āļ™āļ—āļēāļ‡āļ­āļĒāđˆāļēāļ‡āļŠāļąāļ”āđ€āļˆāļ™ āđ€āļŠāđˆāļ™ EnrollmentID āđ€āļāđ‡āļšāđ€āļ›āđ‡āļ™ int (āļ•āļąāļ§āđ€āļĨāļ‚āļˆāļģāļ™āļ§āļ™āđ€āļ•āđ‡āļĄ), EnrollmentDate āđ€āļ›āđ‡āļ™ datetime (āļ§āļąāļ™āđāļĨāļ°āđ€āļ§āļĨāļē) āđāļĨāļ° SchYr_Grade āđ€āļ›āđ‡āļ™ nvarchar(2) (āļ‚āđ‰āļ­āļ„āļ§āļēāļĄ) āļāļēāļĢāļĢāļđāđ‰āļ§āđˆāļēāļĢāļ°āļšāļšāļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ•āđ‰āļ™āļ—āļēāļ‡āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāļĄāļēāđāļšāļšāđ„āļŦāļ™ āļˆāļ°āļŠāđˆāļ§āļĒāđƒāļŦāđ‰āđ€āļĢāļēāļ§āļēāļ‡āđāļœāļ™āđāļ›āļĨāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļ–āļđāļāļ•āđ‰āļ­āļ‡

āļ āļēāļžāļ—āļĩāđˆ 3: āļāļēāļĢāđāļ›āļĨāļ‡āļ›āļĢāļ°āđ€āļ āļ—āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Type Conversion)

āļŠāļīāđˆāļ‡āļ—āļĩāđˆāļāļģāļĨāļąāļ‡āļ—āļģāļ­āļĒāļđāđˆ: āļ‚āđ‰āļ­āļĄāļđāļĨāļ–āļđāļāļ”āļķāļ‡āđ€āļ‚āđ‰āļēāļĄāļēāđƒāļ™ Power Query Editor āđ€āļžāļ·āđˆāļ­āļ—āļģāļāļēāļĢāđāļ›āļĨāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Transformation) āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”: āļ„āļļāļ“āļāļģāļĨāļąāļ‡āļ„āļĨāļīāļāđ€āļĄāļ™āļđ Dropdown āļ—āļĩāđˆāļŦāļąāļ§āļ„āļ­āļĨāļąāļĄāļ™āđŒ EnrollmentID āđ€āļžāļ·āđˆāļ­āđ€āļ›āļĨāļĩāđˆāļĒāļ™āļ›āļĢāļ°āđ€āļ āļ—āļ‚āđ‰āļ­āļĄāļđāļĨ (Change Type) āđ‚āļ”āļĒāļāļģāļĨāļąāļ‡āļˆāļ°āđ€āļ›āļĨāļĩāđˆāļĒāļ™āļˆāļēāļāļ•āļąāļ§āđ€āļĨāļ‚āđƒāļŦāđ‰āļāļĨāļēāļĒāđ€āļ›āđ‡āļ™ Text (āļ‚āđ‰āļ­āļ„āļ§āļēāļĄ)

🛠ïļ āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļŠāļīāđˆāļ‡āļ—āļĩāđˆāđ„āļ”āđ‰āļĨāļ‡āļĄāļ·āļ­āļ—āļģ (Implementation Details)

1.āļāļēāļĢāļŠāļģāļĢāļ§āļˆāđāļĨāļ°āļ­āļ­āļāđāļšāļšāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ•āđ‰āļ™āļ—āļēāļ‡ (SQL Data Profiling & Design): āļ„āļļāļ“āđ„āļ”āđ‰āđ€āļ‚āđ‰āļēāđ„āļ›āļ•āļĢāļ§āļˆāļŠāļ­āļšāđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ•āļēāļĢāļēāļ‡ (Table Schema) āđƒāļ™ SQL Server āđ€āļžāļ·āđˆāļ­āļŦāļēāļˆāļļāļ”āļ—āļĩāđˆāļ›āļĢāļ°āđ€āļ āļ—āļ‚āđ‰āļ­āļĄāļđāļĨāđ„āļĄāđˆāđ€āļŦāļĄāļēāļ°āļŠāļĄ (Type Mismatches) āļĨāļ‡āļĄāļ·āļ­āđāļāđ‰āđ„āļ‚āļ„āļļāļ“āļŠāļĄāļšāļąāļ•āļīāļ‚āļ­āļ‡ Field āļœāđˆāļēāļ™ Design View āđ€āļŠāđˆāļ™ āļāļēāļĢāđ€āļ›āļĨāļĩāđˆāļĒāļ™āļˆāļēāļāļ‚āđ‰āļ­āļ„āļ§āļēāļĄ (VARCHAR) āļ—āļĩāđˆāđ€āļāđ‡āļšāļ•āļąāļ§āđ€āļĨāļ‚ āđƒāļŦāđ‰āļāļĨāļēāļĒāđ€āļ›āđ‡āļ™āļˆāļģāļ™āļ§āļ™āđ€āļ•āđ‡āļĄ (INT) āđ€āļžāļ·āđˆāļ­āļĨāļ”āļ‚āļ™āļēāļ”āļāļēāļĢāļˆāļąāļ”āđ€āļāđ‡āļšāđāļĨāļ°āļ—āļģāđƒāļŦāđ‰āļāļēāļĢāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāļ„āļģāļŠāļąāđˆāļ‡ Query āļĢāļ§āļ”āđ€āļĢāđ‡āļ§āļ‚āļķāđ‰āļ™

2.āļāļēāļĢāđ€āļŠāļ·āđˆāļ­āļĄāļ•āđˆāļ­āđāļĨāļ°āļ”āļķāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Database Connectivity): āļˆāļąāļ”āļāļēāļĢāļ—āļģ Seamless Connection āļĢāļ°āļŦāļ§āđˆāļēāļ‡āļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨ SQL āđāļĨāļ°āđ€āļ„āļĢāļ·āđˆāļ­āļ‡āļĄāļ·āļ­āļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒ āđ€āļžāļ·āđˆāļ­āđƒāļŦāđ‰āļĄāļąāđˆāļ™āđƒāļˆāļ§āđˆāļēāļ‚āđ‰āļ­āļĄāļđāļĨāđ„āļŦāļĨāđ€āļ‚āđ‰āļēāļŠāļđāđˆ Pipeline āđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļ–āļđāļāļ•āđ‰āļ­āļ‡ 100%

3.āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢ ETL āđāļĨāļ°āļāļēāļĢāļ—āļģ Data Casting: āđƒāļŠāđ‰ Power Query āđ€āļ›āđ‡āļ™āđ€āļ„āļĢāļ·āđˆāļ­āļ‡āļĄāļ·āļ­āļŦāļĨāļąāļāđƒāļ™āļāļēāļĢāļ—āļģāļ„āļ§āļēāļĄāļŠāļ°āļ­āļēāļ”āļ‚āđ‰āļ­āļĄāļđāļĨ āļ”āļģāđ€āļ™āļīāļ™āļāļēāļĢ Data Casting āļŦāļĢāļ·āļ­āļāļēāļĢāđāļ›āļĨāļ‡āļ›āļĢāļ°āđ€āļ āļ—āļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™āļ‚āļąāđ‰āļ™āļ•āļ­āļ™āļŠāļļāļ”āļ—āđ‰āļēāļĒ āđ€āļŠāđˆāļ™ āļāļēāļĢāļˆāļąāļ”āļāļēāļĢāļĢāļđāļ›āđāļšāļšāļ§āļąāļ™/āđ€āļ§āļĨāļē (Date/Time) āđāļĨāļ°āļ„āļ§āļēāļĄāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļ­āļ‡āļˆāļļāļ”āļ—āļĻāļ™āļīāļĒāļĄ (Decimal Precision) āđ€āļžāļ·āđˆāļ­āļ›āđ‰āļ­āļ‡āļāļąāļ™āļāļēāļĢāđ€āļāļīāļ” â€œData Loss” āļŦāļĢāļ·āļ­āļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļĩāđ‰āļĒāļ™āļĢāļ°āļŦāļ§āđˆāļēāļ‡āļĒāđ‰āļēāļĒāļˆāļēāļāļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļĄāļēāļĒāļąāļ‡āļĢāļēāļĒāļ‡āļēāļ™

āļŠāļīāđˆāļ‡āļ—āļĩāđˆāđ„āļ”āđ‰āļĢāļąāļšāļˆāļēāļāļāļēāļĢāļ—āļģ Lab āļ™āļĩāđ‰ (Key Outcomes & Takeaways)

āļ„āļ·āļ­āđāļāđˆāļ™āļ‚āļ­āļ‡āļāļēāļĢāļ—āļģ ETL (Extract, Transform, Load) āđ€āļžāļ·āđˆāļ­āđƒāļŦāđ‰āđ„āļ”āđ‰ Data Quality

āļ—āļąāļāļĐāļ°āļāļēāļĢāļ•āļĢāļ§āļˆāļŠāļ­āļšāļ•āđ‰āļ™āļ—āļēāļ‡ (Extraction & Profiling): āļĢāļđāđ‰āļ§āļīāļ˜āļĩāđ€āļ‚āđ‰āļēāļ–āļķāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļ”āļīāļšāļˆāļēāļ SQL Database āđāļĨāļ°āļ•āļĢāļ§āļˆāļŠāļ­āļšāļŠāļ™āļīāļ”āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļ•āļąāđ‰āļ‡āđāļ•āđˆāļĢāļ°āļ”āļąāļš Schema āđ€āļžāļ·āđˆāļ­āļ›āđ‰āļ­āļ‡āļāļąāļ™āļ‚āđ‰āļ­āļœāļīāļ”āļžāļĨāļēāļ”āđƒāļ™āļāļēāļĢāļ”āļķāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ

āļ„āļ§āļēāļĄāđ€āļ‚āđ‰āļēāđƒāļˆāđ€āļĢāļ·āđˆāļ­āļ‡āļšāļĢāļīāļšāļ—āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Context): āđ„āļ”āđ‰āđ€āļĢāļĩāļĒāļ™āļĢāļđāđ‰āļ§āđˆāļēāđ„āļĄāđˆāđƒāļŠāđˆāļ•āļąāļ§āđ€āļĨāļ‚āļ—āļļāļāļ•āļąāļ§āļ„āļ§āļĢāļĄāļĩ Data Type āđ€āļ›āđ‡āļ™āļ•āļąāļ§āđ€āļĨāļ‚āđ€āļŠāļĄāļ­āđ„āļ› āđ€āļŠāđˆāļ™ EnrollmentID āđāļĄāđ‰āļŦāļ™āđ‰āļēāļ•āļēāļˆāļ°āđ€āļ›āđ‡āļ™āļ•āļąāļ§āđ€āļĨāļ‚ āđāļ•āđˆāļĄāļąāļ™āļ„āļ·āļ­ â€œāļĢāļŦāļąāļŠāļ›āļĢāļ°āļˆāļģāļ•āļąāļ§â€ āļ—āļĩāđˆāđ€āļĢāļēāļˆāļ°āđ„āļĄāđˆāļ™āļģāļĄāļēāļšāļ§āļ āļĨāļš āļ„āļđāļ“ āļŦāļēāļĢ āļāļąāļ™ āļāļēāļĢāđāļ›āļĨāļ‡āļ›āļĢāļ°āđ€āļ āļ—āļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļ›āđ‡āļ™ Text āļˆāļ°āļŠāđˆāļ§āļĒāļ›āđ‰āļ­āļ‡āļāļąāļ™āđ„āļĄāđˆāđƒāļŦāđ‰āđ‚āļ›āļĢāđāļāļĢāļĄāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ‚āđ‰āļ­āļĄāļđāļĨāļ™āļģāđ„āļ›āļ„āļģāļ™āļ§āļ“āļ—āļēāļ‡āļ„āļ“āļīāļ•āļĻāļēāļŠāļ•āļĢāđŒāđāļšāļšāļœāļīāļ”āļ§āļąāļ•āļ–āļļāļ›āļĢāļ°āļŠāļ‡āļ„āđŒ

āļ—āļąāļāļĐāļ°āļāļēāļĢāļ—āļģ Data Cleaning āđ€āļšāļ·āđ‰āļ­āļ‡āļ•āđ‰āļ™ (Transformation): āļŠāļēāļĄāļēāļĢāļ–āđƒāļŠāđ‰āļ‡āļēāļ™āđ€āļ„āļĢāļ·āđˆāļ­āļ‡āļĄāļ·āļ­āđ€āļ•āļĢāļĩāļĒāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāļ­āļĒāđˆāļēāļ‡ Power Query Editor āđ„āļ”āđ‰ āļ‹āļķāđˆāļ‡āļ—āļąāļāļĐāļ°āļāļēāļĢāļˆāļąāļ”āđ€āļ•āļĢāļĩāļĒāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāļ”āļīāļšāđƒāļŦāđ‰āļžāļĢāđ‰āļ­āļĄ āļ–āļđāļāļ•āđ‰āļ­āļ‡ āđāļĨāļ°āļ„āļĨāļĩāļ™āļ—āļĩāđˆāļŠāļļāļ”āļāđˆāļ­āļ™āļ™āļģāđ„āļ›āļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ•āđˆāļ­ āđ€āļ›āđ‡āļ™āļ—āļąāļāļĐāļ°āļ—āļĩāđˆāđƒāļŠāđ‰āļˆāļĢāļīāļ‡āđƒāļ™āļāļēāļĢāļ—āļģāļ‡āļēāļ™āļŠāļēāļĒ Data Analytics āđ€āļ›āđ‡āļ™āļ›āļĢāļ°āļˆāļģāļ—āļļāļāļ§āļąāļ™