모델은 어떻게 스스로 “계수”를 조정하는가? 여기서 계수는 딥러닝 모델을 하나의 함수로 보았을때, 가중치를 의미합니다. 1. 딥러닝에서 ‘최적화’란 무엇인가? 딥러닝 모델을 학습한다는 것은 입력과 정답(Label)을 비교해서 오차를 계산하고, 그 오차가 줄어들도록 모델 내부의 파라미터(계수)를 조정하는 과정입니다. 딥러닝 모델은 거대한 함수이고 학습은 그 함수의 “계수”를 계속 수정해가는 과정 즉, 손실이 줄어드는 방향으로 조금씩 이동하는 것이 최적화의 핵심입니다.2. 기본 중의 기본: Gradient Descent2-1. Gradient Descent (경사하강법)가장 기본이 되는 알고리즘으로원리는 아래와 같습니다.현재 위치에서손실 함수의 기울기를 계산하고기울기 반대 방향으로 이동산 위에서 가장 낮..
전체 글
컴퓨터 네트워크는 단순히 “컴퓨터를 연결하는 것”에서 벗어나, 오늘날의 클라우드, IoT, 5G, 그리고 AI 기반 서비스까지 모든 디지털 생태계를 지탱하는 핵심 인프라입니다. 1. 네트워크의 기본 구조컴퓨터 네트워크는 크게 LAN, WAN, MAN으로 나눌 수 있습니다.LAN (Local Area Network): 학교, 회사, 집 등 소규모 지역 내 연결.WAN (Wide Area Network): 국가, 대륙 단위의 광역 네트워크. 인터넷 대부분이 여기에 포함.MAN (Metropolitan Area Network): 도시 규모 네트워크. ISP(인터넷 서비스 제공자)가 사용.최근에는 SD-WAN(Software Defined WAN)이 등장하여, 소프트웨어 기반으로 WAN을 효율적이고 유연하게 ..
Dataset Source : https://www.kaggle.com/datasets/sonalshinde123/work-from-home-employee-burnout-dataset/code Work From Home Employee Burnout DatasetDaily Work Patterns, Productivity & Burnout Riskwww.kaggle.com my project : https://www.kaggle.com/code/lko9911/burnout-risk-classification-ml-dl Burnout Risk Classification || ML & DLExplore and run machine learning code with Kaggle Notebooks | Usin..
원-핫 인코딩은 범주형 데이터를 안전하게 표현하는 가장 직관적인 방법입니다.https://whitecode2718.tistory.com/195 원핫 인코딩을 하는 이유머신러닝이나 딥러닝을 공부하다 보면 가장 먼저 마주치는 전처리 기법 중 하나가 원-핫 인코딩(One-Hot Encoding)입니다. 단순히 “범주형 데이터를 숫자로 바꾸는 방법”이라고만 외우기엔, 왜 이whitecode2718.tistory.com 하지만 실제 문제를 조금만 확장해보면, 곧 한계에 부딪히게 됩니다. 이때 등장한 개념이 임베딩(Embedding)입니다.1. 원-핫 인코딩의 한계에서 출발이전에 설명했듯 원-핫 인코딩은 아래와 같습니다.차원 수 = 범주 개수대부분의 값 = 0의미는 “켜졌는지 / 꺼졌는지” 뿐이 방식은 범주 수가 ..
머신러닝이나 딥러닝을 공부하다 보면 가장 먼저 마주치는 전처리 기법 중 하나가 원-핫 인코딩(One-Hot Encoding)입니다. 단순히 “범주형 데이터를 숫자로 바꾸는 방법”이라고만 외우기엔, 왜 이 방식이 필요한지 이해하지 않으면 모델 설계에서 계속 헷갈리게 됩니다. 이 글에서는 원-핫 인코딩을 왜 쓰는지를 모델의 관점에서 설명하겠습니다.1. 모델은 ‘숫자’만 이해딥러닝 모델은 결국 수학적인 함수입니다.입력 → 가중치(weight) → 연산 → 출력이 과정에서 문자, 카테고리, 의미는 직접 이해하지 못합니다.모델이 다룰 수 있는 건 오직 숫자 벡터 색상RedBlueGreen이 상태로는 모델에 바로 넣을 수 없기 때문에 “숫자로 바꿔야 한다”는 필요성이 생깁니다.2. 그냥 숫자로 바꾸면 생기는 문제가..
회귀분석에서 모델을 헷갈리게 만드는 관계 머신러닝이나 통계 모델을 공부하다 보면 꼭 등장하는 용어가 있는데요. 바로 다중공선성(Multicollinearity)입니다.이 개념은 특히 회귀분석에서 모델 성능 해석을 어렵게 만드는 대표적인 문제입니다. 다중공선성의 의미다중공선성이란 독립변수들 사이에 강한 상관관계가 존재하는 상태를 말합니다.즉, 모델 입장에서 보면 다음과 같습니다. “이 변수랑 저 변수가 너무 비슷해서, 누가 영향을 주는지 잘 모르겠는데…?” 예시: 집값 예측 모델x₁집 크기 (㎡)x₂방 개수y집 가격 집이 클수록 방도 많기 때문에, 보통 집 크기와 방 개수는 매우 강한 상관관계를 가집니다.이때 문제는,집 크기가 가격을 올리는 건지방 개수가 가격을 올리는 건지모델이 정확히 구분하지 못한다는..
피지컬 AI(Physical AI)는 단순히 데이터를 분석하고 결과를 출력하는 기존의 AI를 넘어, 물리적 세계에서 스스로 인지(perceive)하고, 판단(reason)하며, 직접 행동(action)까지 수행할 수 있는 인공지능 기술을 말합니다. 이는 로봇, 자율주행차, 스마트 인프라 등 현실 환경에서 센서 → 인식 → 계획 → 물리적 실행 → 학습의 순환 고리를 구축할 수 있는 AI 시스템을 의미합니다. 대표적으로 엔비디아의 Isaac Sim이 있습니다.https://whitecode2718.tistory.com/182 Isaac Sim이란?아이작심(Isaac Sim)은 엔비디아(NVIDIA)가 개발한 로봇 시뮬레이션 플랫폼입니다.실제 로봇을 만들기 전에 가상 환경에서 로봇의 동작, 센서, 자율주행·..
처음부터 새로 학습하지 않아도, 이미 잘 학습된 ‘기반(foundation)’ 위에 얹어서 쓰는 모델 파운데이션 모델은 대규모 데이터로 사전 학습(pre-training)된 범용 인공지능 모델을 의미합니다. 특정 하나의 작업(task)에만 특화된 모델이 아니라, 다양한 다운스트림 작업에 재사용·확장될 수 있도록 설계된 모델입니다. 특히, 최근에는 대한민국 '독자 AI 파운데이션 모델' 1차 평가 결과 발표가 나오기도 했죠.https://www.aitimes.kr/news/articleView.html?idxno=38163 대한민국 '독자 AI 파운데이션 모델' 1차 평가 결과 발표…LG AI연구원·SKT·업스테이지 2차 진출 -과학기술정보통신부가 추진 중인 국가 전략 프로젝트인 \'독자 AI 파운데..