Теорема Виноградова о среднем — теорема аналитической теории чисел об оценке среднего значения интеграла некоторых тригонометрических сумм, называемого также интегралом Виноградова. Теорема представляет интерес, в частности, потому что оцениваемый в ней интеграл равен количеству решений в целых числах из достаточно большого интервала системы уравнений специального вида.
Принятые в статье обозначения
Поскольку теорема прямым образом касается тригонометрических сумм (а значит, и экспонент с комплексным показателем), то для краткости и удобства мы будем пользоваться обозначением e ( α ) = e 2 π α i {displaystyle eleft({alpha } ight)=e^{2pi alpha i}} , где α ∈ R {displaystyle alpha in {mathbb {R} }} может быть любым числом.
Общее описание задачи
Пусть заданы фиксированные натуральные числа n , k {displaystyle n,k} . Рассмотрим систему уравнений
{ x 1 + x 2 + ⋯ + x k = y 1 + y 2 + ⋯ + y k x 1 2 + x 2 2 + ⋯ + x k 2 = y 1 2 + y 2 2 + ⋯ + y k 2 … x 1 n + x 2 n + ⋯ + x k n = y 1 n + y 2 n + ⋯ + y k n {displaystyle left{{egin{matrix}x_{1}+x_{2}+dots +x_{k}=y_{1}+y_{2}+dots +y_{k}{x_{1}}^{2}+{x_{2}}^{2}+dots +{x_{k}}^{2}={y_{1}}^{2}+{y_{2}}^{2}+dots +{y_{k}}^{2}dots {x_{1}}^{n}+{x_{2}}^{n}+dots +{x_{k}}^{n}={y_{1}}^{n}+{y_{2}}^{n}+dots +{y_{k}}^{n}end{matrix}} ight.}или, более формально,
∑ j = 1 k x j i = ∑ j = 1 k y j i , i = 1 , … , n {displaystyle sum limits _{j=1}^{k}{{x_{j}}^{i}}=sum limits _{j=1}^{k}{{y_{j}}^{i}},i=1,dots ,n}Потребность в рассмотрении такой системы возникает, например, при аналитическом решении проблемы Варинга, но может (в изменённых формулировках) применяться и в других областях.
Если обозначить через J k , n ( P ) {displaystyle J_{k,n}(P)} количество целочисленных решений указанной системы в пределах x i , y i ∈ [ 1 ; P ] , i = 1 , … , k {displaystyle x_{i},y_{i}in [1;P],i=1,dots ,k} , то основной вопрос формулируется так: как быстро растёт J k , n ( P ) {displaystyle J_{k,n}(P)} с ростом P {displaystyle P} ?
Тривиальная оценкой, очевидно, будет J k , n ( P ) ≤ P 2 k {displaystyle J_{k,n}(P)leq P^{2k}}
Теорема Виноградова даёт непосредственные (не асимптотические) намного лучшие, чем тривиальные, оценки сверху на величину J k , n ( P ) {displaystyle J_{k,n}(P)} при фиксированных k {displaystyle k} и n {displaystyle n} .
Формулировка в виде интеграла
Как обычно при использовании тригонометрических сумм, условие соответствия переменных уравнению можно выразить тождеством
[ ∑ j = 1 k x j i − ∑ j = 1 k y j i = 0 ] = ∫ 0 1 e ( ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α ) d α {displaystyle {Bigg [}sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}=0{Bigg ]}=int limits _{0}^{1}{eleft({left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha } ight)dalpha }}Следовательно, количество решений системы уравнений удовлетворяет выражению
J n , k ( P ) = ∑ 1 ≤ x j , y j ≤ P ∏ i = 1 n ∫ 0 1 e ( ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α ) d α = ∑ 1 ≤ x j , y j ≤ P ∫ 0 1 … ∫ 0 1 e ( ∑ i = 1 n ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α i ) d α 1 … d α n = {displaystyle J_{n,k}(P)=sum limits _{1leq x_{j},y_{j}leq P}{prod limits _{i=1}^{n}{int limits _{0}^{1}{eleft({left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha } ight)dalpha }}}=sum limits _{1leq x_{j},y_{j}leq P}int limits _{0}^{1}dots int limits _{0}^{1}{eleft({sum limits _{i=1}^{n}{left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha _{i}}} ight)}dalpha _{1}dots dalpha _{n}=} = ∫ 0 1 … ∫ 0 1 ∑ 1 ≤ x j , y j ≤ P e ( ∑ i = 1 n ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α i ) d α 1 … d α n = ∫ 0 1 … ∫ 0 1 ∑ 1 ≤ x j , y j ≤ P e ( ∑ j = 1 k ( ∑ i = 1 n x j i α i ) − ∑ j = 1 k ( ∑ i = 1 n y j i α i ) ) d α 1 … d α n = {displaystyle =int limits _{0}^{1}dots int limits _{0}^{1}{sum limits _{1leq x_{j},y_{j}leq P}eleft({sum limits _{i=1}^{n}{left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha _{i}}} ight)}dalpha _{1}dots dalpha _{n}=int limits _{0}^{1}dots int limits _{0}^{1}{sum limits _{1leq x_{j},y_{j}leq P}e{left({sum limits _{j=1}^{k}{left({sum limits _{i=1}^{n}{x_{j}}^{i}alpha _{i}} ight)}-sum limits _{j=1}^{k}{left({sum limits _{i=1}^{n}{y_{j}}^{i}alpha _{i}} ight)}} ight)}}dalpha _{1}dots dalpha _{n}=} = ∫ 0 1 … ∫ 0 1 | ∑ x = 1 P e ( ∑ i = 1 n α i x i ) | 2 k d α 1 … d α n = ∫ 0 1 … ∫ 0 1 | ∑ x = 1 P e ( α 1 x + α 2 x 2 + ⋯ + α k x k ) | 2 k d α 1 … d α n {displaystyle =int limits _{0}^{1}dots int limits _{0}^{1}{{Bigg vert }{sum limits _{x=1}^{P}eleft({sum limits _{i=1}^{n}{alpha _{i}x^{i}}} ight)}{Bigg vert }^{2k}}dalpha _{1}dots dalpha _{n}=int limits _{0}^{1}dots int limits _{0}^{1}{{Bigg vert }{sum limits _{x=1}^{P}eleft({alpha _{1}x+alpha _{2}x^{2}+dots +alpha _{k}x^{k}} ight)}{Bigg vert }^{2k}}dalpha _{1}dots dalpha _{n}}Таким образом, искомая величина оценивается через интеграл по суммам Вейля и её можно оценивать, применяя общие для этих сумм методы.
Формулировки теоремы
Хотя основным преимуществом теоремы является ограничение порядка роста J k , n ( P ) {displaystyle J_{k,n}(P)} относительно P {displaystyle P} , сопровождающий этот порядок роста постоянный (при фиксрованных k {displaystyle k} и n {displaystyle n} ) множитель при доказательстве также удаётся выразить явно.
Кроме того, оценки, получаемые в теореме, оказываются тем лучше, чем больше параметр k {displaystyle k} превосходит параметр n {displaystyle n} . Поэтому обычно вводится дополнительный параметр τ {displaystyle au } , выражающий отношение k n {displaystyle {frac {k}{n}}} или каким-либо иным образом параметризующий рост k {displaystyle k} относительно n {displaystyle n} .
В связи с этим, а также в связи со сложностью доказательств теоремы и большим количеством деталей в нём, в различных формулировках теоремы используемые константы и выражения, зависящие только от k {displaystyle k} и n {displaystyle n} , могут отличаться. В частности, значения таких множителей уменьшались, а ограничения на значения ( k , n ) {displaystyle (k,n)} ослаблялись в разное время разными математиками.
В книге И. М. Виноградова 1971 года даётся следующая формулировка:
В учебнике А. А. Карацубы 1983 года доказывается:
Основная лемма
Суть утверждения
Вопрос об оценке числа решения системы уравнений
{ x 1 + x 2 + ⋯ + x k = y 1 + y 2 + ⋯ + y k x 1 2 + x 2 2 + ⋯ + x k 2 = y 1 2 + y 2 2 + ⋯ + y k 2 … x 1 n + x 2 n + ⋯ + x k n = y 1 n + y 2 n + ⋯ + y k n {displaystyle left{{egin{matrix}x_{1}+x_{2}+dots +x_{k}=y_{1}+y_{2}+dots +y_{k}{x_{1}}^{2}+{x_{2}}^{2}+dots +{x_{k}}^{2}={y_{1}}^{2}+{y_{2}}^{2}+dots +{y_{k}}^{2}dots {x_{1}}^{n}+{x_{2}}^{n}+dots +{x_{k}}^{n}={y_{1}}^{n}+{y_{2}}^{n}+dots +{y_{k}}^{n}end{matrix}} ight.}напрямую связан с вопросом о числе решений системы
{ x 1 + x 2 + ⋯ + x k = λ 1 x 1 2 + x 2 2 + ⋯ + x k 2 = λ 2 … x 1 n + x 2 n + ⋯ + x k n = λ k {displaystyle left{{egin{matrix}x_{1}+x_{2}+dots +x_{k}=lambda _{1}{x_{1}}^{2}+{x_{2}}^{2}+dots +{x_{k}}^{2}=lambda _{2}dots {x_{1}}^{n}+{x_{2}}^{n}+dots +{x_{k}}^{n}=lambda _{k}end{matrix}} ight.}при фиксированных λ 1 , … , λ k {displaystyle lambda _{1},dots ,lambda _{k}} . Задачу, похожую на эту, но несколько облегчённую специальными условиями и ослаблением требований, удаётся решить напрямую. Именно решение такой задачи составляет основную лемму, играющую главную роль в доказательстве теоремы Виноградова. Специальные условия, необходимые для возможности непосредственного решения задачи, заключаются в том, что:
- предполагается, что количество переменных равно количеству уравнений;
- предполагается, что переменные принимают значения из разных, сильно отстоящих друг от друга, интервалов — то есть разница между любыми разными x i {displaystyle x_{i}} и x j {displaystyle x_{j}} превосходит некоторую заранее заданную величину;
- вместо требования равенства x 1 s + x 2 s + ⋯ + x k s = λ s {displaystyle {x_{1}}^{s}+{x_{2}}^{s}+dots +{x_{k}}^{s}=lambda _{s}} анализируется требование принадлежности к относительно короткому интервалу, то есть x 1 s + x 2 s + ⋯ + x k s ∈ I s {displaystyle {x_{1}}^{s}+{x_{2}}^{s}+dots +{x_{k}}^{s}in I_{s}} для заданного интервала I s {displaystyle I_{s}} малой длины.
Ограниченность количества решений при заданных условиях очевидна ввиду выпуклости функций x 2 , x 3 , … , x n {displaystyle x^{2},x^{3},dots ,x^{n}} — действительно, если функция f {displaystyle f} выпукла, а интервалы существенно далеко отстоят друг от друга, то и различие величин производной этой функции на этих интервалах сильно отличается. Это означает, что значения f {displaystyle f} на числах из второго интервала будут расположены на координатной прямой более разреженно, чем значения на числах из первого интервала. Следовательно, одинаковые по величине (но разнонаправленные) изменения каких-то двух переменных влекут, в большинстве случаев, неодинаковое по величине изменение значения функции, так что когда сумма x 1 + x 2 {displaystyle x_{1}+x_{2}} остаётся в рамках некоторого короткого интервала при изменении переменной x 1 {displaystyle x_{1}} , то сумма f ( x 1 ) + f ( x 2 ) {displaystyle f(x_{1})+f(x_{2})} меняет значения в очень большом интервале. Если этот большой интервал больше требуемого, то количество решений, соответственно, будет маленьким.
Однако сами по себе соображения выпуклости в классическом доказательстве теоремы не используются, поскольку оно напрямую анализирует свойства целых степеней и коэффициенты получаемых из них многочленов.
Строгая формулировка
Здесь приводится формулировка из книги Карацубы. Формулировка в книге Виноградова аналогична, только несколько отличны множители, зависящие от n {displaystyle n} .
Краткая схема доказательства
Основную сложность составляет доказательство оценки на E 1 {displaystyle E_{1}} . Из неё оценка на E {displaystyle E} выводится тривиально.
Пусть есть две системы ( η 1 , … , η n ) {displaystyle (eta _{1},dots ,eta _{n})} и ( η 1 + ξ 1 , … , η n + ξ n ) {displaystyle (eta _{1}+xi _{1},dots ,eta _{n}+xi _{n})} , суммы степеней которых принадлежат заданным интервалам I 1 , … , I n {displaystyle I_{1},dots ,I_{n}} и ξ n > 0 {displaystyle xi _{n}>0} . Это фактически означает, что
{ ( η 1 + ξ 1 ) − η 1 + ⋯ + ( η n + ξ n ) − η n = θ 1 | I 1 | ( η 1 + ξ 1 ) 2 − η 1 2 + ⋯ + ( η n + ξ n ) 2 − η n 2 = θ 2 | I 2 | … ( η 1 + ξ 1 ) n − η 1 n + ⋯ + ( η n + ξ n ) n − η n n = θ n | I n | {displaystyle left{{egin{matrix}(eta _{1}+xi _{1})-eta _{1}+dots +(eta _{n}+xi _{n})-eta _{n}= heta _{1}|I_{1}|(eta _{1}+xi _{1})^{2}-{eta _{1}}^{2}+dots +(eta _{n}+xi _{n})^{2}-{eta _{n}}^{2}= heta _{2}|I_{2}|dots (eta _{1}+xi _{1})^{n}-{eta _{1}}^{n}+dots +(eta _{n}+xi _{n})^{n}-{eta _{n}}^{n}= heta _{n}|I_{n}|end{matrix}} ight.}где η 1 , … , η n ∈ ( − 1 ; 1 ) {displaystyle eta _{1},dots ,eta _{n}in (-1;1)} . Если во все слагаемые подставить выражение ( η i + ξ i ) s − η i s = ( η i + ξ i ) s − η i s ξ s ξ s {displaystyle (eta _{i}+xi _{i})^{s}-{eta _{i}}^{s}={frac {(eta _{i}+xi _{i})^{s}-{eta _{i}}^{s}}{xi ^{s}}}xi ^{s}} и выразить ξ s {displaystyle xi _{s}} по методу Крамера через дроби вида ( η i + ξ i ) s − η i s ξ s {displaystyle {frac {(eta _{i}+xi _{i})^{s}-{eta _{i}}^{s}}{xi ^{s}}}} (явно раскрыв определители), то из теоремы Лагранжа будет следовать, что ξ s {displaystyle xi _{s}} удовлетворяет при некоторых x 1 ∈ ( η 1 , η 1 + ξ 1 ) , … , x n ∈ ( η n , η n + ξ n ) {displaystyle x_{1}in (eta _{1},eta _{1}+xi _{1}),dots ,x_{n}in (eta _{n},eta _{n}+xi _{n})} решению системы уравнений
{ ξ 1 + ⋯ + ξ n = θ 1 | I 1 | x 1 ξ 1 + … x n ξ n = θ 2 | I 2 | … x 1 n − 1 ξ 1 + … x n n − 1 ξ n = θ | I n | {displaystyle left{{egin{matrix}xi _{1}+dots +xi _{n}= heta _{1}|I_{1}|x_{1}xi _{1}+dots x_{n}xi _{n}= heta _{2}|I_{2}|dots {x_{1}}^{n-1}xi _{1}+dots {x_{n}}^{n-1}xi _{n}= heta |I_{n}|end{matrix}} ight.}Матрица коэффициентов этой системы является матрицей Вандермонда и анализ решений системы оказывается легко произвести, исходя из общеизвестного выражения определителя таких матриц.
Схема доказательства теоремы
Теорема доказывается в интегральной формулировке. Доказательство проводится индукцией по n {displaystyle n} и P {displaystyle P} в несколько этапов:
- наборы, среди которых есть хотя бы n {displaystyle n} таких, что никакие два из них не соседние и не совпадают;
- все остальные наборы.
Приложения
Исторически теорема впервые была использована при решении проблемы Варинга, однако иногда применяется и в других областях теории чисел — например, для оценки коротких сумм Клоостермана.