모델은 어떻게 스스로 “계수”를 조정하는가? 여기서 계수는 딥러닝 모델을 하나의 함수로 보았을때, 가중치를 의미합니다. 1. 딥러닝에서 ‘최적화’란 무엇인가? 딥러닝 모델을 학습한다는 것은 입력과 정답(Label)을 비교해서 오차를 계산하고, 그 오차가 줄어들도록 모델 내부의 파라미터(계수)를 조정하는 과정입니다. 딥러닝 모델은 거대한 함수이고 학습은 그 함수의 “계수”를 계속 수정해가는 과정 즉, 손실이 줄어드는 방향으로 조금씩 이동하는 것이 최적화의 핵심입니다.2. 기본 중의 기본: Gradient Descent2-1. Gradient Descent (경사하강법)가장 기본이 되는 알고리즘으로원리는 아래와 같습니다.현재 위치에서손실 함수의 기울기를 계산하고기울기 반대 방향으로 이동산 위에서 가장 낮..
Computer Science
컴퓨터 네트워크는 단순히 “컴퓨터를 연결하는 것”에서 벗어나, 오늘날의 클라우드, IoT, 5G, 그리고 AI 기반 서비스까지 모든 디지털 생태계를 지탱하는 핵심 인프라입니다. 1. 네트워크의 기본 구조컴퓨터 네트워크는 크게 LAN, WAN, MAN으로 나눌 수 있습니다.LAN (Local Area Network): 학교, 회사, 집 등 소규모 지역 내 연결.WAN (Wide Area Network): 국가, 대륙 단위의 광역 네트워크. 인터넷 대부분이 여기에 포함.MAN (Metropolitan Area Network): 도시 규모 네트워크. ISP(인터넷 서비스 제공자)가 사용.최근에는 SD-WAN(Software Defined WAN)이 등장하여, 소프트웨어 기반으로 WAN을 효율적이고 유연하게 ..
원-핫 인코딩은 범주형 데이터를 안전하게 표현하는 가장 직관적인 방법입니다.https://whitecode2718.tistory.com/195 원핫 인코딩을 하는 이유머신러닝이나 딥러닝을 공부하다 보면 가장 먼저 마주치는 전처리 기법 중 하나가 원-핫 인코딩(One-Hot Encoding)입니다. 단순히 “범주형 데이터를 숫자로 바꾸는 방법”이라고만 외우기엔, 왜 이whitecode2718.tistory.com 하지만 실제 문제를 조금만 확장해보면, 곧 한계에 부딪히게 됩니다. 이때 등장한 개념이 임베딩(Embedding)입니다.1. 원-핫 인코딩의 한계에서 출발이전에 설명했듯 원-핫 인코딩은 아래와 같습니다.차원 수 = 범주 개수대부분의 값 = 0의미는 “켜졌는지 / 꺼졌는지” 뿐이 방식은 범주 수가 ..
머신러닝이나 딥러닝을 공부하다 보면 가장 먼저 마주치는 전처리 기법 중 하나가 원-핫 인코딩(One-Hot Encoding)입니다. 단순히 “범주형 데이터를 숫자로 바꾸는 방법”이라고만 외우기엔, 왜 이 방식이 필요한지 이해하지 않으면 모델 설계에서 계속 헷갈리게 됩니다. 이 글에서는 원-핫 인코딩을 왜 쓰는지를 모델의 관점에서 설명하겠습니다.1. 모델은 ‘숫자’만 이해딥러닝 모델은 결국 수학적인 함수입니다.입력 → 가중치(weight) → 연산 → 출력이 과정에서 문자, 카테고리, 의미는 직접 이해하지 못합니다.모델이 다룰 수 있는 건 오직 숫자 벡터 색상RedBlueGreen이 상태로는 모델에 바로 넣을 수 없기 때문에 “숫자로 바꿔야 한다”는 필요성이 생깁니다.2. 그냥 숫자로 바꾸면 생기는 문제가..
회귀분석에서 모델을 헷갈리게 만드는 관계 머신러닝이나 통계 모델을 공부하다 보면 꼭 등장하는 용어가 있는데요. 바로 다중공선성(Multicollinearity)입니다.이 개념은 특히 회귀분석에서 모델 성능 해석을 어렵게 만드는 대표적인 문제입니다. 다중공선성의 의미다중공선성이란 독립변수들 사이에 강한 상관관계가 존재하는 상태를 말합니다.즉, 모델 입장에서 보면 다음과 같습니다. “이 변수랑 저 변수가 너무 비슷해서, 누가 영향을 주는지 잘 모르겠는데…?” 예시: 집값 예측 모델x₁집 크기 (㎡)x₂방 개수y집 가격 집이 클수록 방도 많기 때문에, 보통 집 크기와 방 개수는 매우 강한 상관관계를 가집니다.이때 문제는,집 크기가 가격을 올리는 건지방 개수가 가격을 올리는 건지모델이 정확히 구분하지 못한다는..
처음부터 새로 학습하지 않아도, 이미 잘 학습된 ‘기반(foundation)’ 위에 얹어서 쓰는 모델 파운데이션 모델은 대규모 데이터로 사전 학습(pre-training)된 범용 인공지능 모델을 의미합니다. 특정 하나의 작업(task)에만 특화된 모델이 아니라, 다양한 다운스트림 작업에 재사용·확장될 수 있도록 설계된 모델입니다. 특히, 최근에는 대한민국 '독자 AI 파운데이션 모델' 1차 평가 결과 발표가 나오기도 했죠.https://www.aitimes.kr/news/articleView.html?idxno=38163 대한민국 '독자 AI 파운데이션 모델' 1차 평가 결과 발표…LG AI연구원·SKT·업스테이지 2차 진출 -과학기술정보통신부가 추진 중인 국가 전략 프로젝트인 \'독자 AI 파운데..
Git은 분산 버전 관리 시스템입니다. 소스 코드의 변경 이력을 기록하고, 여러 사람이 동시에 작업하더라도 변경 내용을 안전하게 관리할 수 있도록 돕는 도구입니다. 2005년 리누스 토르발스가 리눅스 커널 개발을 위해 만들었으며, 현재는 소프트웨어 개발 전반에서 사실상 표준 도구로 사용되고 있습니다. 이번 포스팅에서는 Git과 Github에 대해 간략히 소개하겠습니다.버전 관리 시스템이란?버전 관리 시스템은 파일의 변경 사항을 시간 순서대로 저장하고, 과거 상태로 되돌리거나 변경 내역을 비교할 수 있도록 도와주는 시스템입니다. Git을 사용하면 다음과 같은 작업이 가능합니다.코드 변경 이력 추적특정 시점의 코드로 되돌리기여러 개발자의 작업 병합실수로 삭제된 코드 복구Git의 핵심 개념1. 분산 저장소 구..
현대 차량은 수십 개에서 많게는 수백 개의 ECU(Electronic Control Unit)로 구성되어 있으며, 이들 간의 안정적이고 신뢰성 높은 통신이 필수적입니다. 이러한 요구를 충족하기 위해 등장한 대표적인 차량 네트워크 기술이 CAN과 CAN-FD입니다. 본 글에서는 CAN과 CAN-FD의 기본 개념과 특징, 그리고 두 기술의 차이점을 중심으로 살펴봅니다. 1. CAN 개요 CAN(Controller Area Network)은 차량 및 산업용 시스템에서 널리 사용되는 직렬 통신 프로토콜입니다. 여러 ECU(Electronic Control Unit) 간 데이터를 안정적이고 실시간으로 교환하기 위해 설계되었으며, 자동차 전장 시스템의 표준 통신 방식으로 자리 잡고 있습니다.2. CAN 통신 ..