LG Aimers 4기 그리고 AI 데이터 관련 용어

2024. 1. 2. 21:19컴퓨터 전공 공부/LG Aimers

반응형

LG Aimers: AI전문가과정 4차

LG Aimers 합격

작년 12월 22일날  LG Aimers: AI전문가과정 4기에 선정되어
24년 1월 2일 드디어 교육이 시작되어 설레는 마음으로 학습방에 들어갔습니다.
(사실 지난번에 3기에도 선정되었지만 일주일 안에 모듈 1&2 진도를 나가야한다는 사실을 늦게 알게되었으며 또 계절학기를 수강하고 있었기에 제대로 집중하기가 힘들었습니다.
이번에 다시 신청한 이유는 내년 1학기 수업에서 인공지능을 주로 다루는 수업을 들을 것이기도 하고 인공지능에 관심이 많기에 기초부터 공부를 전문가들과 함께 하고 싶어서 신청했습니다.)

 

AI Essential Course
Module 1 : AI윤리
ㅇ 교수 : KAIST 차미영 교수 
ㅇ 학습 목표
     본 모듈은 본격적인 AI기술에 대한 이해에 앞서 데이터 과학자로서의 기본적 소양을 기르기 위한 과정입니다. 
     따라서 인공지능 기술 도입에 앞서 데이터 과학자로서 그리고 제도적으로 윤리적으로 어떠한 자세를 가져야 하는지 이해하고, 
     인공지능 기술로 어떻게 문제를 해결할 수 있는지 학습합니다. 

 

ㄴ 이 강의에서는 데이터 분석과 AI학습에서 유의할 점을 다루어주셨는데 솔직히 첫 강의이기도 하고 뻔한 이야기들이겠지 했지만 처음 듣는 용어들과 재밌는 사례들 등을 알게 되었고 그래서 시간가는 줄 모르고 수강했습니다.

 

알게된 점, 용어 정리, 정리할 점

데이터 분석과 AI학습에서 유의할 점

-데이터를 분석하는 사람들은 당연히 알아야하고 사람들이 가끔 실수하는 것
 "상관관계와 인과관계는 다르다"

-EDA (exploratory data analysis) : 데이터를 가지고 결과를 내기 전에 RAW DATA에 대해 탐색하는 과정
데이터를 분석할 떄에는 EDA (exploratory data analysis) 충분한 시간을 보내기

-학습에 쓰는 데이터가 충분한 지도 확인을 해야한다.
데이터 학습의 결과가 적절한 수준인지
언더피팅(Under-fitting), 오버피팅(Over-fitting) 이 아닌 Approppirate-fitting

-학습(training) 데이터는 테스트(testing) 데이터와 달라야 함

-오버피팅(Over-fitting)
정당한 수준까지의 학습을 넘어 과도하게 학습된 상태.
학습하는 과정에서 주어진 데이터에 지나치게 적응해서 새롭게 보는 문제나 데이터에 일반화 되지 못하는 상황.

-Black box algorithm
흔히 AI 기반 학습 알고리즘은 설명 가능하지 않고 블랙박스 형태라는 단점이 존재
따라서 High risk 결정에서는 설명력도 정확도 만큼이나 중요해짐.
ㄴ 알고리즘 내면을 가시화하는 것이 중요하다.
사후 설명력(post- hoc explainability)을 제공하는 기술이 생김

-의견의 대표성: Spiral of silence
침묵의 나선 이론이라고도 불리는데 
다수 의견으로 확인된 견해일수록 개인이 활발히 의견을 표명하고 점차 세를 확보하여 더 큰 사회적 목소리로 변하지만, 반대로 소수의 의견이라 여겨질수록 점차 힘을 잃게 되는 모습을 표현하였다.

Spiral of silence

 

-인포데믹(infodemic): 사실정보와 더불어 오정보의 양이 늘어 구분이 어려워지는 정보 과부화 현상.

-COMPAS (Correctional Offender Management Profiling for Alternative Sanctions)
ㄴ Northpointe, Inc가 개발 & 소유한 피고의 미래 범죄 위험을 점수로 예측하는 Software Tool이다.
ㄴ문제점 : COMPAS의 경우 백인 보다 흑인의 위험 점수를 더 크게 보여주는 편향현상을 가짐.

반응형