기획자가 알아야 하는 AI 기초 용어

AI Study

기획자가 알아야 하는 AI 기초 용어

플랜데버 2024. 5. 29. 16:36

AI구현을 위해서는 알고리즘, 데이터, GPU (하드웨어) 가 필요하다,

그래서 요즘 엔비디아 주가가 난리난거임~(GPU는 병렬 산술계산이 어마어마하게 빠르다고 함)

빅데이터분석기사 자격증을 취득하면서 알게된 용어들도 많지만 요즘 랭체인과 스트림릿등으로 실제 구현 해보면서 사용하는 용어들을 정리해 본다. 기획자도 이정도는 알고 있어야 개발자들과 소통이 가능할테니까~

인공지능(AI) ⊃ 머신러닝(Machine Learning) ⊃ 딥러닝 (Deep Learning)

인공지능,머신러닝,딥러닝의 관계 https://www.youtube.com/watch?v=Xkoh-IYqdK4

1. 인공지능(AI, Artificial Intelligence )

인간의 지능을 모방하는 컴퓨터 시스템.

알고리즘으로 데이터를 학습하여 모델을 만드는 기술. 여기서 모델이라 함은 우리가 chatGPT 덕분에 자주 듣는 LLM과 같은 것들이다. AI는 다양한 애플리케이션에서 사용되며, 특히 데이터 분석, 음성 인식, 이미지 처리, 자율 주행 등에 활용된다.

1-1. AI 개발도구

프로그래밍언어 : Python(파이썬)

프레임워크 : TensorFlow(텐서플로우), Keras (케라스) , PyTorch(파이토치) → 알고리즘이 포함되어 있음.

오픈소스 라이브러리 : NumPy (넘파이) , pandas (판다스) → 파이썬 패키지이다.

2. 머신러닝(ML , Machine Learning )

AI의 한 분야로, 명시적인 프로그래밍 없이 데이터를 입력받아 기계가 스스로 학습하여 성능을 개선하는 알고리즘과 기술. 머신러닝 모델은 데이터를 분석하고 패턴을 인식하여 예측을 수행

(전통적인 개발은 사람이 규칙을 정해서 개발을 하지만 머신러닝은 데이터를 학습함으로써 스스로 규칙을 만들어냄.)

2-1. 머신러닝 학습방법

1. 지도학습 : 문제도 주고, 답도준다.

데이터셋은 일반적으로 학습 데이터(Training Data), 검증 데이터(Validation Data), 테스트 데이터(Test Data)로 나눠진다. 나눈 데이터로 예측을 시키고, 평가를 한다.(정확도 혹은 오차율을 측정)

데이터셋의 품질은 모델의 성능에 큰 영향을 미친다.

- 예측은 Predict , 입력값은 Feature , 출력은 Label 라는 영어단어로 대화하니 알아두자! 코딩할때는 입력은 x 출력은 y 로 쓴다. (무엇(x)로 무엇(y)를 예측하고 싶다)

- 지도학습의 종류에는 어떤것을 예측하느냐에 따라 분류와 회귀 로 구분할 수 있다.

- 분석하고자 하는 목적변수(종속변수)가 범주형이라면 분류, 수치형이라면 회귀로 지도학습을 한다.

- 범주형이란 수치가 아닌데이터로 이루어진 것이다, 예를 들어 남자,여자, 과일,야채와 같이 숫자가 아닌값으로 분류를 할수 있는 값들을 학습시켜 결과를 예측하게 한다.

- 수치형이란 숫자형 데이터로 키와 몸무게 값을 주고 키값을 주었을때 몸무게 값을 예측하게 한다.

지도학습기법에는 랜덤포레스트,로지스틱회귀, 서포트백터머신,ANN 등이 있지만 우린 너무 깊게 들어가지 말자 ^___^

2. 비지도학습 : 문제만 주고 학습시킴. 데이터의 특징,패턴,구조를 도출하여 데이터 특성을 스스로 파악함.

- 비지도학습의 종류에는 군집화,차원축소,연관관계분석,딥러닝 등이 있다.

3. 강화학습 : 문제,답 모두 주지 않고, 컴퓨터가 선택한 행동에 대한 반응에 따라 보상을 준다.

- 여기서 보상(Reward)을 준다는 것은 에이전트가 취한 행동의 결과로 주어지는 피드백을 의미. 양의값을 준다던가 음의값을 줌.

- 에이전트 : 특정 목표를 달성하기 위해 환경에서 행동을 선택하고 그 결과를 학습하는 인공지능 시스템 또는 알고리즘.

잘 따라오고 있나? ㅋㅋㅋㅋ 정신줄을 붙잡아 보자!

3. 딥러닝(DL, Deep Learning )

인간의 뉴런에서 영감을 얻어 뇌의 정보처리방식을 모사한 인공신경망(ANN, Artificial Neural Networks)과 유사하게 여러층으로 깊이있게 구성하여 학습을 진행하는 머신러닝 알고리즘의 한 종류이다.

딥러닝은 복잡한 데이터 구조를 분석하고 처리하는 데 뛰어난 성능을 보이며, 이미지 인식, 음성 인식, 자연어 처리(NLP) 등에 사용된다.

3-1 딥러닝 알고리즘 종류

DNN Deep Neural Network 심층신경망 : 입력층, 다수의 은닉층, 출력층으로 구성. 입력층에서 가중치가 곱해져 은닉층으로 이동시키고, 은닉층에서도 가중치가 곱해지면서 다음 계층으로 이동한다. 출력층에서 입력층으로 가는것은 역전파 알고리즘이다, 순방향 전파와 역전파가 반복적으로 수행되면서 최적화된 결과를 도출한다.

식으로 표현하면 y = wx + b(bias) → w(가중치)와 b(편향)를 구하는 과정임.

CNN Convolutional Neural Network, 합성곱 신경망. 시각 이미지,오디오를 분석하는데 사용