<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Performance on nbdawn's Blog</title><link>https://blog.nbdawn.com/kr/tags/performance/</link><description>Recent content in Performance on nbdawn's Blog</description><generator>Hugo -- 0.160.1</generator><language>kr</language><copyright>DJ.Kim 2025</copyright><lastBuildDate>Sun, 12 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.nbdawn.com/kr/tags/performance/index.xml" rel="self" type="application/rss+xml"/><item><title>LLM: 우리가 놓치고 있었던 것들</title><link>https://blog.nbdawn.com/kr/posts/llms-the-things-weve-been-overlooking.ko/</link><pubDate>Sun, 12 Apr 2026 00:00:00 +0000</pubDate><guid>https://blog.nbdawn.com/kr/posts/llms-the-things-weve-been-overlooking.ko/</guid><description>&lt;h1 id="llm-우리가-놓치고-있었던-것들"&gt;LLM: 우리가 놓치고 있었던 것들&lt;/h1&gt;
&lt;p&gt;&amp;ldquo;지금 Temperature 값을 몇으로 쓰고 계신가요?&amp;rdquo; 누군가 이렇게 물어보면 뭐라고 답하시나요? &amp;ldquo;기본값요&amp;rdquo;, &amp;ldquo;0.7이요&amp;rdquo;, 아니면 &amp;ldquo;글쎄요, 그게 중요한가요?&amp;rdquo; 보통 이 세 가지 답변 중 하나일 겁니다. 그리고 왜 그 값을 쓰는지 정당화하려 하면 금세 말문이 막히곤 하죠.&lt;/p&gt;
&lt;p&gt;우리는 지금 LLM을 딱 이 정도로 사용하고 있습니다. 매일 API를 호출하고, 프롬프트를 &lt;code&gt;messages&lt;/code&gt;에 담아 보내고, 응답을 받아오죠. 하지만 &amp;ldquo;Temperature는 실제로 어떤 역할을 하지?&amp;rdquo;, &amp;ldquo;Top-P는 Temperature랑 뭐가 다른 거지?&amp;rdquo;, &amp;ldquo;Prompt Caching은 켜기만 하면 알아서 작동하나?&amp;rdquo;, &amp;ldquo;모델을 더 좋은 걸로 바꾸면 환각(hallucination) 현상이 사라질까?&amp;rdquo; 같은 질문이 나오면 답변이 모호해집니다.&lt;/p&gt;</description></item><item><title>두 번째 GPU가 일을 안 하는 이유: PCIe부터 NVLink까지, x86 I/O 병목 현상 파헤치기</title><link>https://blog.nbdawn.com/kr/posts/why-my-second-gpu-is-lazy-the-hidden-bottleneck-of-x86-io.ko/</link><pubDate>Fri, 02 Jan 2026 00:00:00 +0000</pubDate><guid>https://blog.nbdawn.com/kr/posts/why-my-second-gpu-is-lazy-the-hidden-bottleneck-of-x86-io.ko/</guid><description>Understand how CPUs communicate with GPUs, NVMe drives, and network cards. Learn about MMIO, DMA, PCIe topology, and why your second GPU might be slower than expected.</description></item></channel></rss>