Главная
Новости
Строительство
Ремонт
Дизайн и интерьер




18.04.2021


18.04.2021


18.04.2021


16.04.2021


15.04.2021





Яндекс.Метрика





Теорема Виноградова о среднем

09.03.2021

Теорема Виноградова о среднем — теорема аналитической теории чисел об оценке среднего значения интеграла некоторых тригонометрических сумм, называемого также интегралом Виноградова. Теорема представляет интерес, в частности, потому что оцениваемый в ней интеграл равен количеству решений в целых числах из достаточно большого интервала системы уравнений специального вида.

Принятые в статье обозначения

Поскольку теорема прямым образом касается тригонометрических сумм (а значит, и экспонент с комплексным показателем), то для краткости и удобства мы будем пользоваться обозначением e ( α ) = e 2 π α i {displaystyle eleft({alpha } ight)=e^{2pi alpha i}} , где α ∈ R {displaystyle alpha in {mathbb {R} }} может быть любым числом.

Общее описание задачи

Пусть заданы фиксированные натуральные числа n , k {displaystyle n,k} . Рассмотрим систему уравнений

{ x 1 + x 2 + ⋯ + x k = y 1 + y 2 + ⋯ + y k x 1 2 + x 2 2 + ⋯ + x k 2 = y 1 2 + y 2 2 + ⋯ + y k 2 … x 1 n + x 2 n + ⋯ + x k n = y 1 n + y 2 n + ⋯ + y k n {displaystyle left{{egin{matrix}x_{1}+x_{2}+dots +x_{k}=y_{1}+y_{2}+dots +y_{k}{x_{1}}^{2}+{x_{2}}^{2}+dots +{x_{k}}^{2}={y_{1}}^{2}+{y_{2}}^{2}+dots +{y_{k}}^{2}dots {x_{1}}^{n}+{x_{2}}^{n}+dots +{x_{k}}^{n}={y_{1}}^{n}+{y_{2}}^{n}+dots +{y_{k}}^{n}end{matrix}} ight.}

или, более формально,

∑ j = 1 k x j i = ∑ j = 1 k y j i , i = 1 , … , n {displaystyle sum limits _{j=1}^{k}{{x_{j}}^{i}}=sum limits _{j=1}^{k}{{y_{j}}^{i}},i=1,dots ,n}

Потребность в рассмотрении такой системы возникает, например, при аналитическом решении проблемы Варинга, но может (в изменённых формулировках) применяться и в других областях.

Если обозначить через J k , n ( P ) {displaystyle J_{k,n}(P)} количество целочисленных решений указанной системы в пределах x i , y i ∈ [ 1 ; P ] , i = 1 , … , k {displaystyle x_{i},y_{i}in [1;P],i=1,dots ,k} , то основной вопрос формулируется так: как быстро растёт J k , n ( P ) {displaystyle J_{k,n}(P)} с ростом P {displaystyle P} ?

Тривиальная оценкой, очевидно, будет J k , n ( P ) ≤ P 2 k {displaystyle J_{k,n}(P)leq P^{2k}}

Теорема Виноградова даёт непосредственные (не асимптотические) намного лучшие, чем тривиальные, оценки сверху на величину J k , n ( P ) {displaystyle J_{k,n}(P)} при фиксированных k {displaystyle k} и n {displaystyle n} .

Формулировка в виде интеграла

Как обычно при использовании тригонометрических сумм, условие соответствия переменных уравнению можно выразить тождеством

[ ∑ j = 1 k x j i − ∑ j = 1 k y j i = 0 ] = ∫ 0 1 e ( ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α ) d α {displaystyle {Bigg [}sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}=0{Bigg ]}=int limits _{0}^{1}{eleft({left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha } ight)dalpha }}

Следовательно, количество решений системы уравнений удовлетворяет выражению

J n , k ( P ) = ∑ 1 ≤ x j , y j ≤ P ∏ i = 1 n ∫ 0 1 e ( ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α ) d α = ∑ 1 ≤ x j , y j ≤ P ∫ 0 1 … ∫ 0 1 e ( ∑ i = 1 n ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α i ) d α 1 … d α n = {displaystyle J_{n,k}(P)=sum limits _{1leq x_{j},y_{j}leq P}{prod limits _{i=1}^{n}{int limits _{0}^{1}{eleft({left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha } ight)dalpha }}}=sum limits _{1leq x_{j},y_{j}leq P}int limits _{0}^{1}dots int limits _{0}^{1}{eleft({sum limits _{i=1}^{n}{left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha _{i}}} ight)}dalpha _{1}dots dalpha _{n}=} = ∫ 0 1 … ∫ 0 1 ∑ 1 ≤ x j , y j ≤ P e ( ∑ i = 1 n ( ∑ j = 1 k x j i − ∑ j = 1 k y j i ) α i ) d α 1 … d α n = ∫ 0 1 … ∫ 0 1 ∑ 1 ≤ x j , y j ≤ P e ( ∑ j = 1 k ( ∑ i = 1 n x j i α i ) − ∑ j = 1 k ( ∑ i = 1 n y j i α i ) ) d α 1 … d α n = {displaystyle =int limits _{0}^{1}dots int limits _{0}^{1}{sum limits _{1leq x_{j},y_{j}leq P}eleft({sum limits _{i=1}^{n}{left({sum limits _{j=1}^{k}{{x_{j}}^{i}}-sum limits _{j=1}^{k}{{y_{j}}^{i}}} ight)alpha _{i}}} ight)}dalpha _{1}dots dalpha _{n}=int limits _{0}^{1}dots int limits _{0}^{1}{sum limits _{1leq x_{j},y_{j}leq P}e{left({sum limits _{j=1}^{k}{left({sum limits _{i=1}^{n}{x_{j}}^{i}alpha _{i}} ight)}-sum limits _{j=1}^{k}{left({sum limits _{i=1}^{n}{y_{j}}^{i}alpha _{i}} ight)}} ight)}}dalpha _{1}dots dalpha _{n}=} = ∫ 0 1 … ∫ 0 1 | ∑ x = 1 P e ( ∑ i = 1 n α i x i ) | 2 k d α 1 … d α n = ∫ 0 1 … ∫ 0 1 | ∑ x = 1 P e ( α 1 x + α 2 x 2 + ⋯ + α k x k ) | 2 k d α 1 … d α n {displaystyle =int limits _{0}^{1}dots int limits _{0}^{1}{{Bigg vert }{sum limits _{x=1}^{P}eleft({sum limits _{i=1}^{n}{alpha _{i}x^{i}}} ight)}{Bigg vert }^{2k}}dalpha _{1}dots dalpha _{n}=int limits _{0}^{1}dots int limits _{0}^{1}{{Bigg vert }{sum limits _{x=1}^{P}eleft({alpha _{1}x+alpha _{2}x^{2}+dots +alpha _{k}x^{k}} ight)}{Bigg vert }^{2k}}dalpha _{1}dots dalpha _{n}}

Таким образом, искомая величина оценивается через интеграл по суммам Вейля и её можно оценивать, применяя общие для этих сумм методы.

Формулировки теоремы

Хотя основным преимуществом теоремы является ограничение порядка роста J k , n ( P ) {displaystyle J_{k,n}(P)} относительно P {displaystyle P} , сопровождающий этот порядок роста постоянный (при фиксрованных k {displaystyle k} и n {displaystyle n} ) множитель при доказательстве также удаётся выразить явно.

Кроме того, оценки, получаемые в теореме, оказываются тем лучше, чем больше параметр k {displaystyle k} превосходит параметр n {displaystyle n} . Поэтому обычно вводится дополнительный параметр τ {displaystyle au } , выражающий отношение k n {displaystyle {frac {k}{n}}} или каким-либо иным образом параметризующий рост k {displaystyle k} относительно n {displaystyle n} .

В связи с этим, а также в связи со сложностью доказательств теоремы и большим количеством деталей в нём, в различных формулировках теоремы используемые константы и выражения, зависящие только от k {displaystyle k} и n {displaystyle n} , могут отличаться. В частности, значения таких множителей уменьшались, а ограничения на значения ( k , n ) {displaystyle (k,n)} ослаблялись в разное время разными математиками.

В книге И. М. Виноградова 1971 года даётся следующая формулировка:

В учебнике А. А. Карацубы 1983 года доказывается:

Основная лемма

Суть утверждения

Вопрос об оценке числа решения системы уравнений

{ x 1 + x 2 + ⋯ + x k = y 1 + y 2 + ⋯ + y k x 1 2 + x 2 2 + ⋯ + x k 2 = y 1 2 + y 2 2 + ⋯ + y k 2 … x 1 n + x 2 n + ⋯ + x k n = y 1 n + y 2 n + ⋯ + y k n {displaystyle left{{egin{matrix}x_{1}+x_{2}+dots +x_{k}=y_{1}+y_{2}+dots +y_{k}{x_{1}}^{2}+{x_{2}}^{2}+dots +{x_{k}}^{2}={y_{1}}^{2}+{y_{2}}^{2}+dots +{y_{k}}^{2}dots {x_{1}}^{n}+{x_{2}}^{n}+dots +{x_{k}}^{n}={y_{1}}^{n}+{y_{2}}^{n}+dots +{y_{k}}^{n}end{matrix}} ight.}

напрямую связан с вопросом о числе решений системы

{ x 1 + x 2 + ⋯ + x k = λ 1 x 1 2 + x 2 2 + ⋯ + x k 2 = λ 2 … x 1 n + x 2 n + ⋯ + x k n = λ k {displaystyle left{{egin{matrix}x_{1}+x_{2}+dots +x_{k}=lambda _{1}{x_{1}}^{2}+{x_{2}}^{2}+dots +{x_{k}}^{2}=lambda _{2}dots {x_{1}}^{n}+{x_{2}}^{n}+dots +{x_{k}}^{n}=lambda _{k}end{matrix}} ight.}

при фиксированных λ 1 , … , λ k {displaystyle lambda _{1},dots ,lambda _{k}} . Задачу, похожую на эту, но несколько облегчённую специальными условиями и ослаблением требований, удаётся решить напрямую. Именно решение такой задачи составляет основную лемму, играющую главную роль в доказательстве теоремы Виноградова. Специальные условия, необходимые для возможности непосредственного решения задачи, заключаются в том, что:

  • предполагается, что количество переменных равно количеству уравнений;
  • предполагается, что переменные принимают значения из разных, сильно отстоящих друг от друга, интервалов — то есть разница между любыми разными x i {displaystyle x_{i}} и x j {displaystyle x_{j}} превосходит некоторую заранее заданную величину;
  • вместо требования равенства x 1 s + x 2 s + ⋯ + x k s = λ s {displaystyle {x_{1}}^{s}+{x_{2}}^{s}+dots +{x_{k}}^{s}=lambda _{s}} анализируется требование принадлежности к относительно короткому интервалу, то есть x 1 s + x 2 s + ⋯ + x k s ∈ I s {displaystyle {x_{1}}^{s}+{x_{2}}^{s}+dots +{x_{k}}^{s}in I_{s}} для заданного интервала I s {displaystyle I_{s}} малой длины.

Ограниченность количества решений при заданных условиях очевидна ввиду выпуклости функций x 2 , x 3 , … , x n {displaystyle x^{2},x^{3},dots ,x^{n}} — действительно, если функция f {displaystyle f} выпукла, а интервалы существенно далеко отстоят друг от друга, то и различие величин производной этой функции на этих интервалах сильно отличается. Это означает, что значения f {displaystyle f} на числах из второго интервала будут расположены на координатной прямой более разреженно, чем значения на числах из первого интервала. Следовательно, одинаковые по величине (но разнонаправленные) изменения каких-то двух переменных влекут, в большинстве случаев, неодинаковое по величине изменение значения функции, так что когда сумма x 1 + x 2 {displaystyle x_{1}+x_{2}} остаётся в рамках некоторого короткого интервала при изменении переменной x 1 {displaystyle x_{1}} , то сумма f ( x 1 ) + f ( x 2 ) {displaystyle f(x_{1})+f(x_{2})} меняет значения в очень большом интервале. Если этот большой интервал больше требуемого, то количество решений, соответственно, будет маленьким.

Однако сами по себе соображения выпуклости в классическом доказательстве теоремы не используются, поскольку оно напрямую анализирует свойства целых степеней и коэффициенты получаемых из них многочленов.

Строгая формулировка

Здесь приводится формулировка из книги Карацубы. Формулировка в книге Виноградова аналогична, только несколько отличны множители, зависящие от n {displaystyle n} .

Краткая схема доказательства

Основную сложность составляет доказательство оценки на E 1 {displaystyle E_{1}} . Из неё оценка на E {displaystyle E} выводится тривиально.

Пусть есть две системы ( η 1 , … , η n ) {displaystyle (eta _{1},dots ,eta _{n})} и ( η 1 + ξ 1 , … , η n + ξ n ) {displaystyle (eta _{1}+xi _{1},dots ,eta _{n}+xi _{n})} , суммы степеней которых принадлежат заданным интервалам I 1 , … , I n {displaystyle I_{1},dots ,I_{n}} и ξ n > 0 {displaystyle xi _{n}>0} . Это фактически означает, что

{ ( η 1 + ξ 1 ) − η 1 + ⋯ + ( η n + ξ n ) − η n = θ 1 | I 1 | ( η 1 + ξ 1 ) 2 − η 1 2 + ⋯ + ( η n + ξ n ) 2 − η n 2 = θ 2 | I 2 | … ( η 1 + ξ 1 ) n − η 1 n + ⋯ + ( η n + ξ n ) n − η n n = θ n | I n | {displaystyle left{{egin{matrix}(eta _{1}+xi _{1})-eta _{1}+dots +(eta _{n}+xi _{n})-eta _{n}= heta _{1}|I_{1}|(eta _{1}+xi _{1})^{2}-{eta _{1}}^{2}+dots +(eta _{n}+xi _{n})^{2}-{eta _{n}}^{2}= heta _{2}|I_{2}|dots (eta _{1}+xi _{1})^{n}-{eta _{1}}^{n}+dots +(eta _{n}+xi _{n})^{n}-{eta _{n}}^{n}= heta _{n}|I_{n}|end{matrix}} ight.}

где η 1 , … , η n ∈ ( − 1 ; 1 ) {displaystyle eta _{1},dots ,eta _{n}in (-1;1)} . Если во все слагаемые подставить выражение ( η i + ξ i ) s − η i s = ( η i + ξ i ) s − η i s ξ s ξ s {displaystyle (eta _{i}+xi _{i})^{s}-{eta _{i}}^{s}={frac {(eta _{i}+xi _{i})^{s}-{eta _{i}}^{s}}{xi ^{s}}}xi ^{s}} и выразить ξ s {displaystyle xi _{s}} по методу Крамера через дроби вида ( η i + ξ i ) s − η i s ξ s {displaystyle {frac {(eta _{i}+xi _{i})^{s}-{eta _{i}}^{s}}{xi ^{s}}}} (явно раскрыв определители), то из теоремы Лагранжа будет следовать, что ξ s {displaystyle xi _{s}} удовлетворяет при некоторых x 1 ∈ ( η 1 , η 1 + ξ 1 ) , … , x n ∈ ( η n , η n + ξ n ) {displaystyle x_{1}in (eta _{1},eta _{1}+xi _{1}),dots ,x_{n}in (eta _{n},eta _{n}+xi _{n})} решению системы уравнений

{ ξ 1 + ⋯ + ξ n = θ 1 | I 1 | x 1 ξ 1 + … x n ξ n = θ 2 | I 2 | … x 1 n − 1 ξ 1 + … x n n − 1 ξ n = θ | I n | {displaystyle left{{egin{matrix}xi _{1}+dots +xi _{n}= heta _{1}|I_{1}|x_{1}xi _{1}+dots x_{n}xi _{n}= heta _{2}|I_{2}|dots {x_{1}}^{n-1}xi _{1}+dots {x_{n}}^{n-1}xi _{n}= heta |I_{n}|end{matrix}} ight.}

Матрица коэффициентов этой системы является матрицей Вандермонда и анализ решений системы оказывается легко произвести, исходя из общеизвестного выражения определителя таких матриц.

Схема доказательства теоремы

Теорема доказывается в интегральной формулировке. Доказательство проводится индукцией по n {displaystyle n} и P {displaystyle P} в несколько этапов:

  • Интервал [ 1 ; P ] {displaystyle [1;P]} разбивается на некоторое (зависящее от n {displaystyle n} ) количество подинтервалов, и кратная тригонометрическая сумма под интегралом раскладывается на совокупность таких сумм по каждой возможной комбинации k {displaystyle k} таких интервалов;
  • Все наборы подинтервалов делятся на две группы:
    • наборы, среди которых есть хотя бы n {displaystyle n} таких, что никакие два из них не соседние и не совпадают;
    • все остальные наборы.
  • После этого общее количество решений ограничивается суммой количеств решений для наборов каждого из этих двух множеств (умноженной на константу 2).
  • Из первого множества наборов выбирается какой-то один, для которого квадрат модуля тригонометрической суммы максимален. После этого сумма по всем наборам оценивается тривиально умножением суммы по лучшему набору на количество наборов.
  • Через неравенство между арифметическим и геометрическим средними в выбранном наборе из первого множества 2 k − 2 n {displaystyle 2k-2n} из 2 k {displaystyle 2k} переменных «вгоняются» в какой-то один интервал (то есть доказывается, что если они пробегают некоторый, один для всех, интервал вместо своего, то количество решений не уменьшается). То есть на данном этапе система уравнений приведена к виду, когда 2 n {displaystyle 2n} переменных пробегают разные, отстоящие друг от друга интервалы, а 2 k − 2 n {displaystyle 2k-2n} переменных пробегают какой-то один и тот же интервал.
  • Количество решений получившейся системы уравнений выражается суммой по произведениям количеств представлений того или иного числа
  • Количество представлений разностью сумм переменных из 2 k − 2 n {displaystyle 2k-2n} одинаковых интервалов выносится за скобки и оценивается через предположение индукции (поскольку и количество переменных и диапазон их значений малы по сравнению с начальными);
  • После вынесения множителя за скобки выражение для количества решений уравнения превращается в выражение для количества решений неравенства, ограничивающего разность двух степенных сумм. Количество решений этого неравенства оценивается через основную лемму.
  • Для второго множества наборов подинтервалов просто доказывается, что таких наборов очень мало. Далее опять все переменные приводятся к одному (но меньшему по длине, чем P {displaystyle P} ) интервалу, а это уже позволяет применить предположение индукции к наилучшему из них (в смысле наибольшего количества решений).
  • Приложения

    Исторически теорема впервые была использована при решении проблемы Варинга, однако иногда применяется и в других областях теории чисел — например, для оценки коротких сумм Клоостермана.