반응형
내용
목표
- 인턴 합격하기
- 학교 생활 무사히 마치기
- 학생성공스토리 쓰기
옵시디언 백업하기
그 밖에 한일, 잡설
- 동아리에서 기획역할 피그마를 하면서 강제로 조금이나마 실력이 늘고 있다. 그래도 남들이 피그할줄 아냐고 물어보면 그렇다고 대답할 수 있는 수준은 되도록
- 기억의 방 방식으로 숫자 01~99 두자릿수 연상기억법 표를 만들었다.
- 인턴 중간에 면접보고 자소서 쓰고 바빴다. 학교 공부도 따라가기 힘든데 같이 하려니까 힘들었다.
- 체험형 인턴 3군데 썼는데 면탈, 예비 1번, 최종합 이렇게 나왔다. 그래서 다음달 7일부터 판교 내려가서 살아야 한다. 잘 할 수 있을지 걱정은 된다. 근데 뭐 존재하면 된다. 못한다고 자르진 않겠지 설마. 잘라도 내팔자다. 애초에 잘릴정도로 못하면 내 입장에서도 짤리는게 맞는거고. 아무튼 그래서 가기전에 방,정장, 머리 등 다양한 걸 미리 준비해야 하며 다른 방학 계획은 취소했다. 그리고 가기전에 책으로 인공지능 조금 공부하고 가야겠다.
- 배운 것 형식을 바꾸었다. 이전에 유튜브만 기록하는 것도 있지만 GPT 와 대화에서 얻은 인사이트, 내가 질문했던 것들도 소재가 될 것 같아 한번 쫙 정리했다.
- 기존 루틴을 없앴다. 영어공부는 방학떄 OPIC 자격증 목표로 단기적으로 바꾸려고 한다. 근데 운동은 해야하는데 잘 모르겠다. 거기 내려가서 운동할만한 곳이 있을까?
- 서울런을 끝마쳤다.
- 힘든 학기였다. 끝마쳐서 다행이다. 집중해야할 거리를 최대한 줄이고 휴식을 배당해야지 장기적으로 더 생산성이 높아지는 것 같다.배운 것
==날짜== | ==배운 것== |
---|---|
1일 | |
2일 | |
3일 | |
4일 | |
5일 | |
6일 | 거짓말, 사기를 감지하는 방법 1. 불균형한 이득 구조. 상대방은 이득이 없는데 나한테 굳이? 이사람은 분명 뭔가 다른 부분에 이익이 있다. 2. 정보 격차를 이용한 권위: 자신만 아는 정보, 그사람만 검증가능한 정보를 내세움. 내가 그 사람이 구라치는지 알 수 없음 3. 속도 압박과 감정호소 4. 굳이 말 안했는데 알아서 자기포장, 자기는 그런 사람아니다 라고 선제방어 5. 계약화 문서화 회피 6. 상대방이 나에게 배신할 유인이 있는가? 그럴경우 페널티는 무엇인가? 7. 상대방이 나에게 정보를 교류하는가? 아니면 일방적인가? 8. 쌍방 노력으로 이루어지는 관계인가? 아니면 일방적인가? |
7일 | 크롬 브라우저는 다른 브라우저에 비해 멀티 프로세스 격리 수준이 높고, 실행속도를 위해 메모리를 많이 먹으며, 백그라운드 탭을 오래 살려둔다. 또한 특정 OS에서만 사용하는 OS 최적화가 되지 않아 메모리를 많이 잡아 먹는다. |
8일 | CNN은 딥러닝에서 주로 시각, 청각, 시계열 데이터를 처리하는 구조로 벡터가 나열된 이미지나 시계열 데이터에서 활용된다. 커널이라는 인접한 데이터를 함께 곱하고 더하면서 변화적인 특성을 얻어낼 수 있다. 임커밋 추천시스템을 유사도로 측정하면 코사인이나 피어쓴 상관계수를 썼다. 근데 그러면 메모리 커질수록 너무 커진다. 그래서 행렬을 두 행렬의 작은 곱인 행렬 분해 방식을 쓴다. 딥러닝 이전에는 이 행렬분해 방식을 썼다. readyman 구글 CEO 오피셜로 한국의 인공지능은 안좋다 한다. 우선 GPU가 없다. 그리고 중국에 넘어갈까봐 잘 안주는 것도 있다. 인재도 없다. 인프라도 없다. 프로젝트도 없다. 전기도 없다. 지식한입 LLM에 대한 설명을 요약한다. 기본적인 원리는 지금까지 나온 단어를 바탕으로 다음 단어를 예측한다. 그래서 훈련과정으로 마지막 단어만 빈칸만 비워놓고 역전파 방식으로 조정한다. 하지만 이 방식만으로는 너무 오래걸려서 사람이 직접 강화학습하고 조정해 주는 것, GPU 가 도입되고 결정적으로 트랜스포머 모델 도입이 핵심이었다. 순차적으로 읽는 것이 아니라 전체 문장을 한번에 처리한다. 숫자 벡터로 바꾸어서 어텐션이라는 알고리즘을 바탕으로 처리한다. 이를 통해 근처 단어를 통해 의미가 조절된다. 피트포워드 네트워크라는 연산이 이 트랜스포머의 일종이다. 3blue1brown meta 태그에 관해 다룬다. head에 들어가서 name, content를 딕셔너리처럼 대응해서 쓴다. robot.txt와 description으로 미리보기, pwa 지정, 상단 헤드바 색깔, 공유 꾸미기, 비트코인 주소 등 웬만한건 다 들어간다. 우아한테크 |
9일 | - P 문제: "쉽게 풀 수 있는 문제" - NP 문제: "답이 맞는지 쉽게 확인할 수 있는 문제" - P = NP?: "답이 맞는지 쉽게 확인할 수 있다면, 그 답을 쉽게 구할 수도 있을까?" 그러니까 모든 쉬운 문제인 p 문제는 더 어렵고 근본적인 문제인 np-complete로 치환이 가능하다. 하지만 np-complete를 쉬운 방식으로 풀수 있는지 없는지는 모른다. 만약 모든 np-complete를 더 쉬운 방식으로 풀수 있다면 모든 문제를 쉽게 풀 수 있다. np-complete문제끼리는 서로 환원이 되어서 저기 np-complete 문제중에 하나라도 P로 바꿀 수 있다면, 결국 모든 문제를 쉽게 풀 수 있다. “P-NP 문제는 답이 주어졌을 땐 맞는지 빠르게(다항시간에) 확인할 수 있지만, 답을 찾는 건 오래 걸린다. 그래서 ‘답을 찾는 것도 빠르게 할 수 있냐?’가 P=NP 문제의 핵심이다.” |
10일 | d̵̨͍̭͎͇̦̝̓̽͂̂̋́̉͠ͅļ̴̨̟̻̺̹̫̪̞̲̪̀̎̒̓̑͂͜f̶͈̜̙̝͔͑j̷̛̻͚̦̲̣͑͒͆͌̈́͌͑̃̀̓͌͂̈̿͊͝ͅs̷̡̢̛̳͈̲̭̪̳̠͓̱̫̦̠͚͉̿͛̈́͊́̆̓͘x̴̛̳̳̝̟̪͓̒̊͜p̴͚̂͑̅̊́̿ŕ̵̝̱̪̼͓͇̖̦̮̰̪͖͇̏̅̎̑́̈́̐t̶͙̄̈́̐̔̉̓͜m̷̡̪̭̼͓̫̜̳̬̠̏͊͋̀͊̏͑̌͋̇̓̒̒̽͑̂̕x̷̧̤̥̺͖̞̙̼̻̥̫̜͔̳̘̝̉͗̇͒̎̓̏͐͐̏͌̒̋̀͆m̴̘͍͊̇́̀͗̆͊͊̈́̇̕̚̚͝͝d̵͈̼̝̈́͗̏̈́͝͠͝l̷̞̩̹͎̭̘̬͔̎͐̔̾͊̈́̈́̋̋͛̅̈́͝s̵̙͇͔̻̪̩̮͍̮͖̹̅͑̂̈̿̇̎̏͐̕͘͝r̶̡̧̛̜̖̥̈́͂̄̓̀́͊͑͂̋͆̉́̑̕j̸̠̖̭̈́w̶̭͗̈̈́̏͑͗̑̐̂̓̈́́͘̚l̵̨̫̬̜̭͕̗̟̼̤̙̭͙̱̅̒̽͂͛̈́͘ 이렇게 보이는 zalgo text는 유니코드에서 여러 글자를 계속 위로 결합시켜서 하나의 글자처럼 보이게 만든다. 그래서 하나의 글자로 처리되기에 높이가 빠져나갈 수 있다. |
11일 | - elastic search는 대량의 데이터를 저장하고 빠르게 검색, 분석 가능하게 해주는 엔진으로 검색기능, 로그 분석, 대시보드, 추천시스템필터링 등에 쓰인다. 분산형 구조로 확장성이 좋고 rest APi 연동이 쉽다. 백엔드에 붙여 사용하는 보조 유틸리티, 검색 서버이다. - ORM 은 객체지향 프로그래밍 언어(python, java 등)와 MYSQL과 같은 DB 언어에 붙여 사용하는 방식이다. |
12일 | 심리게임에서 자주 쓰이는 인지전략 - 가짜 유도심문: 상대에게 일부러 유리한 거짓 진술을 하도록 제안함. 예시 나는 그가 B랑 같이 갔음을 알고 있는데, 너 A랑 같이갔지? 라고 물어보는 것 - 대놓고 틀린명제 말하기: 너 빵점맞았다며? 뭔소리야 30점인데. 아차 - 가짜 역점 말하기: 나 지금 누구한테 이렇게해서 속은 것 같아. - 질문 대답 후 침묵 유지해 불안하게 해 추가적인 대답 덧붙이게 하기 - 가짜 이지선다: A때문이야? B때문이야? 사실 C에 관한 선택지 유도 - 상대의 의도 곡해: 너 그때 나간거 의심 안받으려고 나간거구나. 일부러 정정 유도 - 가짜 연루 전략: 보이스피싱 연루된 것 처럼. D 말로는 너가 A랑 같이 마피아라 하던데(실제론 그런말 한 적 없음). 이를 정정하기 위해 A와의 관계에 관한 추가 정보 줄 가능 성 있음. 상대의 인지부하 유도 - 상호 모순된 질문 2가지: 너 그때 A랑 있었지? 응. 10분뒤 너 그때 B랑 있었지? 응 이렇게 시간 텀 두며 거짓인 명제 둘다 참으로 대답하게 유도해 스스로 모순 유도 - 무조건 적인 그렇구나 수용 뒤에 추가 꼬리질문 순수한 척 물어보기 |
13일 | cnn: 이미지 같은 2차원 데이터 처리 효과적임. 지역적 특징 추출 위해 합성곱 사용. rnn: 시간순서가 있는데이터 처리에 특화적. |
14일 | 자막이 있는데 수화 방송을 하는 이유가 뭘까? 자막은 모국어를 글자로 표현한 것이지만 청각장애인들은 글자 습득 자체에 어려움이 있어 읽기 능력역시 낮을 수 있다. 그리고 수화가 빠르고 직관적이며 청각장애인 문화정체성의 일부이다. 시력이 좋지 않거나 난독증이 있는 사람들에게는 자막보다 수화가 더 효과적일 수 있다. |
15일 | 트랜스포머 모델은 RNN,CNN이 가지고 있던 한계를 극복한 새로운 구조의 딥러닝 모델이다. 특히 NLP에서 엄청난 성능을 보였다. 각 단어가 문장의 다른 단어들과 얼마나 관련있는지: attetention, 서로 참조 가능하게하는 self-attention, 순서를 처리할 수 있게 위치정보 더한 postional encoding, 인코더- 디코더 혼합구조가 핵심이다. |
16일 | CORS는 실제로 사용자가 접속중인 사이트를 기준으로 판단되기에 스푸핑이 쉽지 않다. 아예 가짜 URL과 SSL 인증서를 받아야 하는데 그것은 불가하다. 그러면 프론트엔드에서 Access-Control-Allow-Origin 같은 헤더를 조작하는 것은 어떨까? 우선 해당 헤더는 서버가 클라이언트에게 보내는 응답이고, 프론트엔드에서는 request만 조작할 수 있기에 불가하다. 개발자 도구에서 request를 요청하더라도 브라우저에서 컷 한다. 그렇다면? 브라우저를 커스텀해서 자기가 만들면? 이를 막기 위한 보안 정책으로는 - 서버 응답의 access-control-allow-origin:* 를 credentials: true와 함께 사용해서는 안된다. - origin을 그대로 응답에 넣어서는 안된다. - preflight 요청을 무조건 허용하면 안됨 - 클라이언트의 access-control-allow-headers:* 을 사용하지 않기 |
17일 | FCM은 서버 단의 방식으로 앱이 설치되다 마다 발급되는 고유한 식별자이다. 그래서 사용자 ID와 함께 저장되며, 원하는 사용자에게 보내기 위해서는 해당 사용자의 정보가 클라이언트가 아닌 서버에 저장이 되어있어야 한다. firebase topic을 사용하지 않는 이상 말이다. |
18일 | 오컴의 면도날은 창조설을 뒷받침하지 않는다. 오컴의 면도날은 단순하다고 사실이라고 말하는 도구가 아니다. 그저 선호하자는 도구일 뿐이다. 그리고 창조설은 오히려 가설을 추가한다. 초월적 존재를 가정하고, 그 존재의 탄생과, 세상 창조 등 훨씬 더 복잡해진다. 또한 오컴의 면도날은 과학이론의 검증 가능성과 예측력, 반증 가능성을 중시해 과학이론끼리 비교하는 이론이여서 창조설 뒷받침에는 적합하지 않다. |
19일 | 금속에 일부 향균기능 있다면서 파상풍은 왜 걸릴까? 향균기능 있는 금속은 구리, 은, 아연등의 일부 금속으로 금속이온이 세포막 파괴해 향균기능 있음. 하지만 다른 흙같은게 묻어있거나 포자상태 혹은 그 외의 다른 향균기능 없는 금속때문에 걸릴 수 있다. |
20일 | HTTP vs HTTPS. HTTP는 원래 보안이라는 게 없어서 도청, 위조, 변조 등이 가능했음. 그래서 SSL/TLS 라는 보안 프로토콜 얹음. 그래서 암호화 하고, 무결성 체크하고, 인증서를 넣음. |
21일 | 토큰과 세션 모두 인증 및 상태관리에 차이되지만 토큰은 인증정보 인코딩한 문자열로 상태가 없음, 클라이언트 측에 저장되며 쿠키나 스토리지에 저장됨. 대표적인 예시가 Json 형태의 토큰인 JWT. 로그인하면 서버가 토큰 만들고, 클라이언트는 저장 그리고 클라이언트는 요청시 헤더에 해당 토큰을 보내서 인증함. 서버 재시작해도 유효하지만 노출되면 ㅈ됨. 그래서 토큰 무효화 로직 필요함 세션은 서버가 상태정보 저장하고 관리하며, 클라이언트는 세션 ID가 있음. 그래서 클라이언트는 세션 ID 만 쿠키로 저장하고 그 상태는 서버에 저장해 상태가 있는 방식. 즉 토큰처럼 세션 ID 받아서 사용하지만 그 상태는 서버에서 관리함. 그래서 바로 무효화 가능하고 보안 이슈가 줄지만, 서버 부담 증가 |
22일 | 우주에서는 원래 왼쪽과 오른쪽이 구별되지 않는 즉 좌우등방성을 가지고 있는 걸로 알고 있었으나 약한 핵력에서는 이게 성립하지 않는다는 걸 밝혀냈다. |
23일 | addblock 을 무시하는 기술의 종류 1. anti- addblock: 광고 스크립트 로딩 안되면 광고 차단 해제해달라고 메시지를 띄움. bait 요소를 DOM에 넣고 그것이 숨겨졌는지 확인 2. 클라우드 CDN을 기반으로 URL 기반 필터링을 피하고 .png나 .mp4와 같이 광고를 웹 리소스로 사용 3. 내부에서 게시물로 직접 html 요소로 작성 4. 우회형 광고 플랫폼의 경우 광고를 동적으로 삽입 ,js 난독화 사용 하지만 이를 또 무시하는 addblock 기술로 cosmetic filter, script filter, network filter를 조합해 위의 방법들도 우회함. |
24일 | 벤포드 법칙은 각 숫자의 첫번째 자릿수의 개수 분포를 따진다. 이는 로그 스케일에서 숫자가 커질수록 그 간격이 달라서 그렇다. 가령 log 2 - log1 은 log 8 - log7 보다 훨씬 크다. 그래서 로그스케일에서 성립하기에 우선 데이터셋 자체에 로그를 씌웠을때 잘 분포가 되어있어야지 벤포드를 따를 가능성이 높아진다. 그래서 로또 번호 같은건 따르지 않고 인구수나 재무재표, 자연 측정 수치 등이 따른다. |
25일 | p값 0.05 는 역사적, 실용적, 관습적으로 사용되지만 막상 그 이유에 대해서는 그다지 명확하지 않다. |
26일 | eraser 는 덮어쓰기 방식으로 사실상 포렌식을 막는다. 다만 이레이저는 레지스트리, 브라우저 캐시, 시스템 로그, 삭제파일의 메타데이터,os 캐시 등은 건드리지 않고 드라이브만 건드리기에 따로 처리를 해주어야 한다. 또한 SSD에서는 동작 신뢰도가 낮아서 일부 남아있을 수 있다. |
27일 | 이데올로기는 불변의 도덕법칙이 지배하며 모든 운명은 명쾌히 결정되어 있다고 말한다. 이는 생각할 필요성을 줄이고, 정답표에 맞게 해석할 수 있게 하며, 같은 정답표를 가진 사람들과 세상을 공유하며 서로를 중요한 존재로 이해한다. 인지적 유연성 없이는 이런 극단적인 주장을 더 쉽게 받아들인다. 이 경우 처음 의견을 고수하며, 편견이 심하다 . 또한 명확히 구분되는 상하관계를 선호하며, 다른 생각을 받아들이는 건 패배로 인식한다. 진화적으로 이런 이데올로기를 안전한 둥지로 인식한다. 자연스럽다고 여기는 모든 강요된 의무와 규칙이 사실은 그러지 않을 수 있다. 지식은날리지 복잡계 이론에 대해 다룬다. 푸엥카레의 삼체문제, 양자역학의 관찰자 개입, 로렌츠 방정식의 소수점 단위로 급변하는 날씨와 무한궤도 등이 복잡계 이론의 근간이 되었다. 나비엔 스트로크 방정식으로 날씨를 예측하려고 한다. 모든 대기분자를 계산할 수 없기에 100km 짜리 그리드로 계산하면 일주일정도의 날씨를 예측할 수 있다. 이 부피를 1/8 로 줄이면? 8주뒤의 날씨도 예측할 수 있을까? 1주 반정도가 한계이다. 즉 무한히 쪼개도 2주 뒤의 날씨가 한계이다. 즉 로그함수 적으로 예측이 가능하기에 무한소수점을 알지 못하는 이상 아무리 뛰어나도 예측에 한계는 있다. 이후, 학자들은 초결정론을 제시하였다. 지식은 날리지 중력은 창발적 현상일까? 모든 힘의 법칙에 중력이 포함되지 않는 이유가, 중력이 본질이 아닌 다른 현상에서 비롯된 결과라는 해석이 있다. 중력과 생명체 또한 엔트로피 증가의 현상일 뿐이라는 것이다. 지식은 날리지 |
28일 | 뉴럴네트워크 기초에 대해 다룬다. activation: 뉴런 안에 있는 값, 액티베이션이 다음 레이어의 액티베이션에 영향을 줌. 처음 입력값이 히든레이어에 영향을 줌. 웨이트는 각 가중치로 음수가 될 수 있다. 0 3blue1brown 한국어 훈련은 각 함수에서 최솟값을 찾는거다. 즉 랜던하게 설정된 값들을 이제 답을 알려주고, 쓰레기 같은 값과의 차(코스트)를 줄이기 위해 현재 기울기에서 어느쪽으로 이동해야 코스트가 작아지는지 확인하고 이동한다. 즉 절대최솟값이 아닌 임의의 최소로 이동한다. 이 과정을 역전파라고 한다. 그래디언트 펑션은 어떤 가중치를 조정하는게 더 큰 영향을 주는지 더 가파른 가중치를 알려준다. 3blue1brown 한국어 이런 역전파 과정을 빠르게 하기 위해 전체 경사를 계산하는게 아닌 일부 예시로만 계산하는 미니배치 방식, 그리고 확률적인 방식을 활용한다. 3blue1brown 한국어 |
29일 | |
30일 | |
31일 | - |
반응형
'성장하는 일상' 카테고리의 다른 글
3학년 1학기 과목들: 나는 무엇을 배웠는가? (0) | 2025.07.01 |
---|---|
2025년 5월 결산 (1) | 2025.06.02 |
2025년 4월 결산 (1) | 2025.04.30 |
2025년 3월 결산 (1) | 2025.03.31 |
2025년 2월 결산 (0) | 2025.03.05 |