O cache é uma área de transferência intermediária com acesso rápido. Contém uma cópia das informações armazenadas na memória com o menor acesso rápido, economizando o tempo do usuário.
O cache é uma memória com maior velocidade de acesso, projetada para agilizar o processo de acesso aos dados que estão permanentemente contidos na memória principal. O cache de dados é usado por discos rígidos, CPUs, navegadores e servidores da Web. O cache inclui um conjunto de entradas. Cada um deles está associado a um item ou bloco de dados. Cada uma das entradas possui um identificador que identifica a correspondência entre os dados do cache e as cópias da memória principal. Quando o cliente (CPU, navegador da web, sistema operacional) acessa os dados, o cache é examinado primeiro. Se contiver um registro com um identificador que corresponda ao identificador do item de dados requerido, os dados do cache são obtidos. Quando os itens de dados no cache são atualizados, eles são modificados na memória principal. No cache, onde há uma gravação imediata, qualquer alteração provoca uma atualização dos dados da memória principal. Em um cache de write-back (write-back), ocorre uma atualização na remoção do item, na solicitação do cliente ou periodicamente. Vários modelos de unidades de processamento central possuem seu próprio cache para minimizar o processo de acesso à memória de acesso aleatório (RAM) do dispositivo, que é mais lento do que os registradores. O cache da CPU é dividido em vários níveis (até 3). A memória mais rápida é considerada o cache de primeiro nível, ou cache L1. É parte integrante do processador, pois está localizado na mesma matriz com ele e faz parte dos blocos funcionais. L2-cache - cache do segundo nível e a velocidade correspondente de desempenho. Geralmente está localizado na matriz, como L1, ou não muito longe do núcleo, por exemplo, em um cartucho de processador (em processadores de slot). O cache L3 é o menos rápido e geralmente localizado separadamente do núcleo da CPU, é mais lento do que outros caches, mas mais rápido do que o operacional.