물체 검출 알고리즘 오늘은 영상 관련 Toy project를 하기 위해 물체의 특징 기반 검출 알고리즘인 Haar cascade에 대해 알아보겠습니다. (얼굴 검출에 흔하게 소개되는 이론입니다.) Haar cascade algorithm Haar feature는 "Alfred Haar"에 의해 1909년에 제안되었다고 해요. 오늘날의 Convolution Kernel과 하는 일은 유사합니다. 2001년 Viola와 Jones가 "Rapid Object Detection using a Boosted Cascade of Simple Features"라는 논문에서 특징 기반의 물체 검출 Algorithm으로 "Haar cascade"를 소개했습니다. Algorithm은 크게 4가지 단계로 구성됩니다. Haar..
공공데이터 포털 오늘은 "의료기관"데이터 분석을 해볼게요. 최종 목표는 "서울의 종합병원 위치를 지도에 표시" 것입니다. 정확히 말하면 AI를 다루기 전 단계인 "데이터 분석"입니다. 데이터 찾기 먼저 분석할 데이터가 있어야겠죠? 데이터는 공공데이터포털(링크)에서 제공하는 공공데이터를 활용하겠습니다. 방법은 간단해요. 공공데이터 포털 접속 ➡️ 원하는 데이터 검색 ➡️ 다운로드하기 데이터는 csv 파일이나 xml, 오픈 API 등으로 제공됩니다. 오늘 활용할 데이터는 소상공인 시장 진흥공단에서 제공하는 "의료기관" 데이터입니다. csv 파일이네요. 최근 수정일은 21년 8월 26일이네요. 서울시 종합병원 위치 분석 데이터 확인 어떤 데이터인지 파악을 해야 전 처리를 할 수 있겠죠? 확인부터 해봅시다! 데..
Matplotlib Matplotlib 란? Matplotlib는 데이터 시각화와 그래프 플롯에 사용되는 Python 라이브러리입니다. Matplotlib을 이용하면 다양한 유형의 그래프를 간단하게 만들 수 있습니다. Matplotlib를 사용하려면 먼저 불러와야겠죠. pyplot이라는 모듈을 사용해야 합니다. 이 모듈은 MATLAB과 비슷하게 명령어 스타일로 동작하는 함수의 모음입니다. (matplotllib.pyplot 은 별칭으로 plt를 사용해요.) import matplotlib.pyplot as plt Line Line plot 그리기 먼저 line plot을 그려볼게요. .plot( ) - line plot을 그리는 함수 import numpy as np import matplotlib.py..
Pandas Pandas란? Pandas는 구조화된 데이터를 효과적으로 처리하고 저장하는 Python 라이브러리 중 하나입니다. Panal Data System의 약자이며, Panal Data란 행과 열로된 엑셀과 유사한 Data를 의미해요. 자료 정제 및 분석을 빠르고 쉽게 할 수 있는 자료구조와 관리 도구들을 가지고 있어요. 또한 Array 계산에 특화된 Numpy, for 문없이 계산하는 벡터화 계산을 기반으로 설계되었어요. 수치해석 도구인 SciPy, 자료분석 라이브러리인 statsmodels, scikit-learn, 시각화 도구인 matplotlib 등과 같이 사용해요. 배열을 다루는 Numpy 와 Pandas 에는 큰 차이점이 있어요. Numpy는 같은 자료형에 대한 배열을 주로 다루고, P..
Numpy Numpy (Numerical Python)란? Numpy 는 행렬이나 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬의 라이브러리입니다. 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공해요. 파이썬에는 행렬을 표현하는 기본적인 자료형이 존재하지 않아요. 그래서 벡터 행렬 계산을 효율적으로 처리하기 위해 Numpy 라이브러리를 이용하죠. Numpy 라이브러리는 Numeric 라이브러리와 NumArray 라이브러리가 합쳐져 높은 수준의 다차원 배열 계산을 고속으로, 효율적으로 처리할 수 있어요. 또한 위에서 언급한 것처럼 N차원 배열 객체를 이용한 선형 대수학이나 푸리에 변환 등의 수치계산 기능을 지원해요. 그렇다면 AI 와는 어떤 관련이 있을까요? AI 에서 말..